목록뉴스기사크롤링 (2)
DevSSOM
네이버 뉴스 기사내용 추출하기 이전 글에 이어서 이번엔 기사 내용까지 추출하는 실습. 마찬가지로 네이버 뉴스 속보 페이지에서 실습을 진행. 사용 url :https://news.naver.com/main/list.nhn 언론사별 속보 뉴스 언론사별 속보 뉴스를 제공합니다. news.naver.com 이번에는 특정 분야를 입력받으면 해당 분야의 속보 기사들의 href를 얻고, 그 href로 각각의 기사로 접근하여 기사의 내용을 크롤링해보겠음. 출력 예시 ["특정 분야의 기사 내용 1", "특정 분야의 기사 내용 2"... ] 해야할 것 get_request, get_href, crawling 함수를 올바르게 구현하기 get_request : 문자열 형태의 분야 이름이 매개변수로 주어지면, 해당 분야의 뉴스..
뉴스기사 목록의 내용 수집하기 수집하는 페이지에 연동되어 있는 href를 추출하여 href 주소에 있는 내용을 크롤링해보기. 이전의 실습들은 언론 기사의 href만 크롤링했다면, 이번에는 각 기사의 내용까지 수집하는 것까지 실습. 사용 url : https://news.sbs.co.kr/news/newsflash.do?plink=GNB&cooper=SBSNEWS SBS 뉴스 최신/속보 대한민국 뉴스의 기준, 중심을 지키는 저널리즘 SBS뉴스 - 시청자의 눈높이에 맞는, 더욱 품격 있는 뉴스를 제공합니다. news.sbs.co.kr 출력 예시 [“href로 연결된 기사 내용1”, “href로 연결된 기사 내용2”, ——] 해야할 것 각 기사의 href를 리스트로 반환하는 get_href 함수를 올바르게 구..