목록Python (43)
DevSSOM
Numpy란? : Numerical Python의 약자로, 파이썬에서 대규모 다차원 배열을 다룰 수 있게 도와주는 라이브러리. 즉, 2차원 이상의 많은 데이터를 다룰 수 있게해줌. Numpy 왜 써? 데이터의 대부분은 숫자 배열로 볼 수 있음. 예를 들어, 왼쪽 아래의 사진 이미지를 현미경으로 확대해서 본다고 하면, 하나의 네모를 픽셀이라고 말할 수 있는데, 픽셀 하나하나의 밝고 어두운 정도인 명암을 숫자로 나타낼 수 있음. 가로 1차원과 세로 1차원의 곱으로 이루어져 있어서 결국, 2차원이 됨. 오른쪽 아래의 파도처럼 생긴 그래프가 사운드 데이터라고 했을 때, 가로축은 시간, 세로축은 소리라고 할 수 있음. 이 곡선에서 각각 하나의 점을 찍어서 숫자로 나타낼 수 있는데, 그러면 1차원의 배열의 데이터가..
Daum 증권 페이지에서 주가 크롤링 Daum 증권 페이지 http://finance.daum.net/ 에서 보여주는 인기 검색 상위 10개 기업의 결과는, 이전처럼 HTML 문서를 분석하여 크롤링하는 방식을 사용할 수 없음. 웹 페이지가 API로부터 실시간으로 변하는 주식의 정보를 주기적으로 요청하여 표시하고 있기 때문. 그래서 웹에서 요청하는 서버에 직접 요청하여 json 데이터를 얻은 후 출력해보기. API의 URL은 개발자 도구의 Network 탭에서 얻을 수 있음. 출력 예시 (1, '삼성전자', 54500) (2, '삼성중공업', 6970) ... 해야할 것 get_data 함수를 올바르게 구현하기. get_data : json 파일로부터 원하는 데이터를 추출한 리스트를 반환합니다. 팁 jso..
엑셀 파일 불러오기 이전 글에서 만들었던 워크북에서 1부터 100까지 채운 데이터를 불러올거야. 이전 글: 2021.07.15 - [Python/업무자동화] - Python 업무자동화(RPA) - 반복문으로 여러 셀에 데이터 넣기 from openpyxl import load_workbook # 파일 불러오기 wb = load_workbook("sample.xlsx") # sample.xlsx 파일에서 워크북을 불러옴 ws = wb.active # 활성화된 시트 # cell 데이터 불러오기 for x in range(1, 11): for y in range(1, 11): print(ws.cell(row=x, column=y).value, end=" ") # end=" " : 셀 하나에 한 줄이 아니라, ..
API Application Programming Interface의 줄임말. 어떤 프로그램과 또 다른 프로그램을 연결해주는 매개체임. 컴퓨터를 다루기 위해 마우스와 키보드를 이용하는 것처럼 API는 프로그램과 프로그램 사이를 연결해주는 역할을 함. 예를 들어, 지도 데이터를 이용해서 맛집 찾기 웹 서비스를 제작하려면 어떻게 해야할까? 보통 사람들은 지도 데이터를 애초에 가지고 있지도 않고, 지도 데이터를 수집하는 것 또한 매우 어려운 일임. 그런데, 어느 날 구글이 가지고 있던 지도 데이터를 공개했다고 가정해봐. 하지만 원본 데이터는 너무 방대하기도 하고, 호환성 등의 문제도 있어서 쉽게 사용할 수가 없어. 그래서 구글은 지도 데이터를 응용해서 사용할 수 있도록 Google Map API라는 매개체를 ..
반복문으로 랜덤 숫자 데이터 넣기 # 먼저 random import 하기 from random import * for x in range(1, 11): # 10개 row for y in range(1, 11): # 10개 column ws.cell(row=x, column=y, value=randint(0, 100)) # 0 ~ 100 사이의 숫자 반복문과 인덱스로 1부터 100까지 채우기 index = 1 for x in range(1, 11): # 10개 row for y in range(1, 11): # 10개 column # ws.cell(row=x, column=y, value=randint(0, 100)) # 0 ~ 100 사이의 숫자 ws.cell(row=x, column=y, value=i..
특정 영화 리뷰 추출하기 리뷰를 알고 싶은 영화의 제목을 입력하면, 해당 영화의 리뷰들의 제목을 알려주는 프로그램을 제작. ["특정 영화의 리뷰 제목 1", "특정 영화의 리뷰 제목 2", "특정 영화의 리뷰 제목 3"...] 해야할 것 get_url, get_href, crawling 함수를 올바르게 구현하기 get_url : main 함수에서 입력된 영화 제목을 네이버 영화 검색창에 검색하였을 때 나오는 url을 반환해야함. get_href : get_url에서 얻은 url로 접근하였을 때, 가장 위에 존재하는 영화의 href를 반환. crawling : 이전에 구현하였던 영화 리뷰 추출 방식과 동일. 팁 get_href 함수를 구현할 때 유의할 점. - 이것은 어떤 영화의 기본 정보를 보여주는 UR..
네이버 뉴스 기사내용 추출하기 이전 글에 이어서 이번엔 기사 내용까지 추출하는 실습. 마찬가지로 네이버 뉴스 속보 페이지에서 실습을 진행. 사용 url :https://news.naver.com/main/list.nhn 언론사별 속보 뉴스 언론사별 속보 뉴스를 제공합니다. news.naver.com 이번에는 특정 분야를 입력받으면 해당 분야의 속보 기사들의 href를 얻고, 그 href로 각각의 기사로 접근하여 기사의 내용을 크롤링해보겠음. 출력 예시 ["특정 분야의 기사 내용 1", "특정 분야의 기사 내용 2"... ] 해야할 것 get_request, get_href, crawling 함수를 올바르게 구현하기 get_request : 문자열 형태의 분야 이름이 매개변수로 주어지면, 해당 분야의 뉴스..
네이버 뉴스 섹션들 기사 href 추출하기 네이버 뉴스 속보 페이지에는 여러 섹션이 있음. 이번엔 “정치”, “경제”, “사회”, “생활”, “세계”, “과학”으로 나뉘어진 다양한 분야의 속보 기사를 추출하는 실습. https://news.naver.com/main/list.nhn?sid1=100 언론사별 속보 뉴스 언론사별 속보 뉴스를 제공합니다. news.naver.com 위 url에서, sid1 부분으로 분야를 설정할 수 있음. 100 정치 103 생활 101 경제 104 세계 102 사회 105 과학 해야할 것 get_request 함수를 올바르게 구현하기. get_request 함수에 문자열 형태의 분야 이름이 들어가면, 해당 분야의 뉴스 속보 홈페이지의 GET 요청의 응답을 반환해야 함. ge..