'데이터프레임' 태그의 글 목록

250x250

Notice

Recent Posts

Recent Comments

Today

Total

관리 메뉴

목록데이터프레임 (4)

DevSSOM

파이썬 pandas - 데이터프레임 분석용 함수

집계함수 집계함수는 많은 데이터 값을 입력으로 받아 이를 요약하는 하나의 값을 반환하는 기능을 하는데, count(), max(), min(), sum(), mean() 등의 함수들을 위와 같은 집계함수라고 함. - df.count() count 메소드를 활용해서 데이터 개수를 확인할 수 있음 (디폴트는 NaN값 제외) data = { 'korean' : [50, 60, 70], 'math' : [10, np.nan, 40] } df = pd.DataFrame(data, index = ['a', 'b', 'c']) # df 결과값 korean math a 50 10.0 b 60 NaN c 70 40.0 # 각 컬럼별 데이터 개수 df.count(axis = 0) # 열 기준으로 카운트 # 결과값 kore..

Python/기초 2021. 7. 26. 13:23

파이썬 pandas - 데이터프레임 정렬하기

데이터프레임 정렬하기 데이터를 처리하다 보면 일정한 기준에 맞추어 정렬하는 일이 빈번하게 발생함. pandas에서도 데이터를 필요에 맞게 정렬할 수 있음. 인덱스값 기준으로 정렬하기 sort_index() 함수를 사용. axis = 0 : 행 인덱스를 기준으로 정렬 (디폴트는 오름차순 ascending = True) df = df.sort_index(axis = 0) axis = 1 : 열 인덱스(컬럼)를 기준으로 정렬 (내림차순 ascending = False) df = df.sort_index(axis = 1, ascending = False) 컬럼값 기준으로 정렬하기 sort_values 함수를 사용. col1 컬럼 기준으로 오름차순 정렬 df.sort_values('col1', ascending ..

Python/기초 2021. 7. 26. 12:46

파이썬 pandas - 데이터프레임의 데이터 선택, 추가, 수정하기

데이터 선택하기 1. 인덱싱 / 슬라이싱 데이터프레임이나 시리즈 데이터에서 데이터를 찾는 방법은 두 가지가 있음. loc : 명시적 인덱스를 참조하는 함수. 쉽게 말하면, 데이터프레임에 어떤 인덱스가 있는지 알고 딱 이름을 넣어서 걔만 빼오는 거야. loc는 location의 약자. iloc : 암묵적인 인덱스를 참조하는 함수. 인덱스 값이 뭔지 모를 때, '아... 그그 첫번째 인덱스 있잖아? 그거 빼와.' 해서 빼오는 거. 학교 선생님들이 반에서 몇 번 불러서 발표시키는 것처럼. # Country DataFrame population gdp korea 5180 169320000 japan 12718 516700000 china 141500 1409250000 usa 32676 2041280000 co..

Python/기초 2021. 7. 26. 12:22

파이썬 pandas - 데이터프레임

데이터프레임 (DataFrame) 여러 개의 Series가 모여서 행과 열을 이룬 데이터. 시리즈 데이터는 하나의 컬럼 값으로 이루어진 반면 데이터 프레임은 여러 개의 컬럼 값을 가질 수 있음. 데이터프레임 만들기 1) 딕셔너리 -> 시리즈 -> 데이터프레임 cf. 시리즈를 만들 때 꼭 딕셔너리로 먼저 만들어야 되는 건 아님. Series([1, 2, 3, 4]) 이렇게 바로 시리즈로 만들 수도 있음. import pandas as pd # 딕셔너리 -> 시리즈 데이터로 만들기 population_dict = { 'korea' : 5180, 'japan' : 12718, 'china' : 141500, 'usa' : 32676 } population = pd.Series(population_dict) g..

Python/기초 2021. 7. 26. 12:22

Prev 1 Next

목록데이터프레임 (4)

DevSSOM

티스토리툴바