목록딕셔너리 (5)
DevSSOM
데이터 선택하기 1. 인덱싱 / 슬라이싱 데이터프레임이나 시리즈 데이터에서 데이터를 찾는 방법은 두 가지가 있음. loc : 명시적 인덱스를 참조하는 함수. 쉽게 말하면, 데이터프레임에 어떤 인덱스가 있는지 알고 딱 이름을 넣어서 걔만 빼오는 거야. loc는 location의 약자. iloc : 암묵적인 인덱스를 참조하는 함수. 인덱스 값이 뭔지 모를 때, '아... 그그 첫번째 인덱스 있잖아? 그거 빼와.' 해서 빼오는 거. 학교 선생님들이 반에서 몇 번 불러서 발표시키는 것처럼. # Country DataFrame population gdp korea 5180 169320000 japan 12718 516700000 china 141500 1409250000 usa 32676 2041280000 co..
데이터프레임 (DataFrame) 여러 개의 Series가 모여서 행과 열을 이룬 데이터. 시리즈 데이터는 하나의 컬럼 값으로 이루어진 반면 데이터 프레임은 여러 개의 컬럼 값을 가질 수 있음. 데이터프레임 만들기 1) 딕셔너리 -> 시리즈 -> 데이터프레임 cf. 시리즈를 만들 때 꼭 딕셔너리로 먼저 만들어야 되는 건 아님. Series([1, 2, 3, 4]) 이렇게 바로 시리즈로 만들 수도 있음. import pandas as pd # 딕셔너리 -> 시리즈 데이터로 만들기 population_dict = { 'korea' : 5180, 'japan' : 12718, 'china' : 141500, 'usa' : 32676 } population = pd.Series(population_dict) g..
Pandas? : 파이썬 라이브러리로, 구조화된 데이터를 효과적으로 처리하고 저장함. Array 계산에 특화된 Numpy를 기반으로 설계됨. Series 데이터 Numpy의 array가 보강된 형태. 데이터와 인덱스를 가지고 있음. 특수한 딕셔너리라고 생각하면 쉬움. import pandas as pd data = pd.Series([1, 2, 3, 4]) print(data) # 0 1 # 1 2 # 2 3 # 3 4 # dtype: int64 print(type(data)) # print(data.values) # [1 2 3 4] print(type(data.values)) # 앞에 세로형으로는 인덱스가 있고 그 다음에 데이터가 있음. 데이터 1, 2, 3, 4 의 앞열에 인덱스 0, 1, 2, 3..
네이버 뉴스 섹션들 기사 href 추출하기 네이버 뉴스 속보 페이지에는 여러 섹션이 있음. 이번엔 “정치”, “경제”, “사회”, “생활”, “세계”, “과학”으로 나뉘어진 다양한 분야의 속보 기사를 추출하는 실습. https://news.naver.com/main/list.nhn?sid1=100 언론사별 속보 뉴스 언론사별 속보 뉴스를 제공합니다. news.naver.com 위 url에서, sid1 부분으로 분야를 설정할 수 있음. 100 정치 103 생활 101 경제 104 세계 102 사회 105 과학 해야할 것 get_request 함수를 올바르게 구현하기. get_request 함수에 문자열 형태의 분야 이름이 들어가면, 해당 분야의 뉴스 속보 홈페이지의 GET 요청의 응답을 반환해야 함. ge..
딕셔너리는 우리말로 -> 사전. 영한사전에 영어단어를 검색하면, 한글 뜻이 나오잖아. 이 때 영어단어와 한글 뜻은 하나의 짝꿍이야. 이렇게 짝꿍이 있는 자료형을 딕셔너리라고 해. 딕셔너리(Dictionary) 딕셔너리 자료형은 중괄호 { }로 묶어서 표현. 짝꿍은 { key : value }의 형식으로, key를 알면 value를 알 수 있음. - key : 열쇠처럼 자료를 꺼낼 수 있는 도구 - value : 딕셔너리에서 Key로 꺼낸 자료 dict_zero = {} dict_one = {"one":1} dict_three = {"one":1, "two":2, "three":3} person = {'name':'Som', 'age': 20} print(person['name'] # Som print(p..