목록Python (43)
DevSSOM
bugs 실시간 음원차트 순위 추출하기 bugs 실시간 음원차트의 순위별로 곡명을 담은 리스트를 출력하기. https://music.bugs.co.kr/chart 슈퍼사운드 벅스 4천만곡 음악서비스, 슈퍼사운드, 고음질, FLAC, 최신 인기가요, 뮤직PD, 커넥트, 페이코, 추천 플레이리스트, 추천 선곡, 테마 음악 music.bugs.co.kr 출력 예시 [곡명1, 곡명2, 곡명3, ———] 팁 \n은 개행문자(줄바꿈 문자). \n을 포함한 문자열 변수 text가 있을 때, \n을 제거하기 위해서는 text.replace("\n","") 활용. str.replace("a", "b") : 문자열 str에 등장하는 "a"란 문자를 모두 "b"로 대체하는 함수 import requests from bs4 ..
연합뉴스 속보 기사 제목 추출하기 네이버 뉴스 연합뉴스 속보 페이지의 기사 제목을 출력해보기. https://news.naver.com/main/list.nhn?mode=LPOD&mid=sec&sid1=001&sid2=140&oid=001&isYeonhapFlash=Y 네이버 뉴스 다양한 기사 정보를 제공합니다. news.naver.com 출력예시 [기사제목1, 기사제목2, 기사제목3, ———] 해야할 것 crawling 함수는 네이버 뉴스 페이지의 연합뉴스 기사들을 찾고, 그것들의 제목을 담고 있는 리스트를 반환해야 함. 주어진 코드는 main 함수와 crawling 함수가 있습니다. main 함수에서는 crawling 함수의 결과값을 출력. main 함수를 직접 수정하실 필요는 없음. crawling..
네이버 헤드 뉴스 찾기 이번 실습에서는 네이버 홈페이지에서 표시되는 헤드라인 뉴스를 전부 크롤링하여 출력해보고자 함. 해야할 것에 맞춰 올바른 코드 작성하기. 위 사진의 빨간 상자 부분이 헤드 뉴스. 출력 예시는 아래처럼. [헤드뉴스1, 헤드뉴스2, 헤드뉴스3, ———] 해야할 것 주어진 코드는 main 함수와 crawling 함수가 있음. main 함수에서는 crawling 함수의 결과값을 출력. main 함수를 직접 수정하실 필요는 없음. crawling 함수를 올바르게 구현해봐. crawling 함수는 네이버 메인 페이지의 헤드 뉴스를 찾고, 그것들의 제목을 담고 있는 리스트를 반환해야 함. 팁 list.append() : 리스트의 맨 뒤에 요소를 추가하는 파이썬 메소드입니다. soup.find()..
크롤링이란? : 웹 페이지에서 필요한 데이터를 추출해내는 작업. 크롤링을 하는 프로그램은 크롤러라고 함. BeautifulSoup 라이브러리 : HTML, XML, JSON 등 파일의 구문을 분석하는 모듈. 웹 페이지를 표현하는 HTML을 분석하기 위해 사용함. 1. BeautifulSoup 시작하기 HTML 파일로 BeautifulSoup 객체를 만들 수 있음. 변수 이름은 관습적으로 soup이라고 지음. "html.parser"의 의미는, BeautifulSoup 객체에게 "HTML을 분석해라"라고 알려주는 것. "html.parser"는 파이썬 내장 클래스. 별도로 써주지 않으면 BeautifulSoup 객체는 자동으로 "html.parser"가 작동됨. soup = BeautifulSoup(ope..
객체 : 성질과 할 수 있는 행동을 담은 자료. 지금까지 우리가 배워온 걸로는 성질은 주로 변수, 할 수 있는 행동은 주로 함수로 얘기되어 왔는데, 이 둘을 하나로 합친 자료인 객체라는 애를 만들어냄. 예를 들어서, 객체를 어피치라고 하면 [성질] 이름 : 어피치 나이 : 10대 후반 ~ 20대 초반 성별 : 자웅동체 [할 수 있는 행동] 춤추기 울기 웃기 클래스(Class) : 객체를 만들 수 있는 틀. 이모티콘이라면 말이야... 이름, 나이, 성별(성질)이 있어야 하고 엉덩이 흔들기, 모르는척 하기, 땡강부리기(행동)을 할 줄 알아야 돼. 그래서 이 객체를 찍어내는 클래스를 만들기 위해서 class 클래스이름: 으로 생성. class Emoticon 클래스 안에는 성질과 행동을 담아줘야 하니까 필드(..
반복문 : 어떠한 '조건'이나, '범위 내'에서 어떠한 명령을 반복적으로 수행하는 것. ex. 숙제를 12시 30분까지 하겠어! 숙제를 10페이지만큼 하겠어! for문 : 원소로 반복하는 방법. 시퀀스의 원소를 하나씩 변수에 넣어가면서 명령 실행. for문에 들어갈 명령들은 같은 들여쓰기로 구분되고, 명령은 len(시퀀스)번 만큼 실행됨. for 변수 in 시퀀스: # 시퀀스에서 각각의 원소에는 인덱스가 있어 # 그 인덱스로 나눠진 원소들을 변수에 하나하나 넣어가면서 명령을 실행한다는 의미 # 그리고 그 for문 안에는 실행시킬 어떤 명령도 함께 주어지는것 이 for문은 '범위'에 관련된 반복문이야. 그 범위는 파이썬에서 시퀀스로 주어짐. 그리고 이 시퀀스 안에서 반복이 일어나는 것. ex. [1, 2,..
시퀀스 자료형 : 순서가 있는 자료형. 리스트, 문자열, 튜플 등이 이에 속함. a = "Once" # 문자열. 순서가 있으니까 >> 시퀀스 b = ['T', 'W', 'I', 'C', 'E'] # 리스트도 순서가 있으니까 >> 시퀀스 c = (1, 2, 3, 4, 5) # 튜플도 순서가 있으니까 >> 시퀀스 시퀀스 자료형의 특징 1. 원소간의 순서가 존재 -> 인덱싱 / 슬라이싱이 가능. a = "Once" b = ['T', 'W', 'I', 'C', 'E'] print(a[1]) # n print(b[2:4]) # ['i', 'c'] + 인덱싱 / 슬라이싱을 할 때 음수를 넣거나, 자리를 비우는 것도 가능. a = "Once" b = ['T', 'W', 'I', 'C', 'E'] print(a[-1]..
list.append(넣을자료) : 자료를 리스트 마지막 원소 뒤에 추가. 온리 한 개의 자료만 넣을 수 있음. a = [] b = ['a', 'b', 'c'] a.append(10) # a 리스트에 10 추가 b.append('d') # b 리스트에 'd' 추가 print(a, b) # [10] ['a', 'b', 'c', 'd'] list.insert(인덱스번호, 넣을자료) : 리스트의 몇 번째 인덱스 자리에 자료를 추가. 온리 한 개의 자료만 넣을 수 있음. c = [1, 2, 4, 5] c.insert(2, 3) # 위치, 값 print(c) # [1, 2, 3, 4, 5] list.remove(뺄 자료) : 리스트에서 자료를 빼줘. 뺄 자료가 중복일 땐, 처음 나오는 애만 제거. d = [3, ..