목록HTTP (1)
DevSSOM
파이썬 크롤링 - BeautifulSoup 기본 개념
크롤링이란? : 웹 페이지에서 필요한 데이터를 추출해내는 작업. 크롤링을 하는 프로그램은 크롤러라고 함. BeautifulSoup 라이브러리 : HTML, XML, JSON 등 파일의 구문을 분석하는 모듈. 웹 페이지를 표현하는 HTML을 분석하기 위해 사용함. 1. BeautifulSoup 시작하기 HTML 파일로 BeautifulSoup 객체를 만들 수 있음. 변수 이름은 관습적으로 soup이라고 지음. "html.parser"의 의미는, BeautifulSoup 객체에게 "HTML을 분석해라"라고 알려주는 것. "html.parser"는 파이썬 내장 클래스. 별도로 써주지 않으면 BeautifulSoup 객체는 자동으로 "html.parser"가 작동됨. soup = BeautifulSoup(ope..
Python/크롤링
2021. 6. 21. 13:42