목록리스트 (4)
DevSSOM
데이터 선택하기 1. 인덱싱 / 슬라이싱 데이터프레임이나 시리즈 데이터에서 데이터를 찾는 방법은 두 가지가 있음. loc : 명시적 인덱스를 참조하는 함수. 쉽게 말하면, 데이터프레임에 어떤 인덱스가 있는지 알고 딱 이름을 넣어서 걔만 빼오는 거야. loc는 location의 약자. iloc : 암묵적인 인덱스를 참조하는 함수. 인덱스 값이 뭔지 모를 때, '아... 그그 첫번째 인덱스 있잖아? 그거 빼와.' 해서 빼오는 거. 학교 선생님들이 반에서 몇 번 불러서 발표시키는 것처럼. # Country DataFrame population gdp korea 5180 169320000 japan 12718 516700000 china 141500 1409250000 usa 32676 2041280000 co..
Numpy란? : Numerical Python의 약자로, 파이썬에서 대규모 다차원 배열을 다룰 수 있게 도와주는 라이브러리. 즉, 2차원 이상의 많은 데이터를 다룰 수 있게해줌. Numpy 왜 써? 데이터의 대부분은 숫자 배열로 볼 수 있음. 예를 들어, 왼쪽 아래의 사진 이미지를 현미경으로 확대해서 본다고 하면, 하나의 네모를 픽셀이라고 말할 수 있는데, 픽셀 하나하나의 밝고 어두운 정도인 명암을 숫자로 나타낼 수 있음. 가로 1차원과 세로 1차원의 곱으로 이루어져 있어서 결국, 2차원이 됨. 오른쪽 아래의 파도처럼 생긴 그래프가 사운드 데이터라고 했을 때, 가로축은 시간, 세로축은 소리라고 할 수 있음. 이 곡선에서 각각 하나의 점을 찍어서 숫자로 나타낼 수 있는데, 그러면 1차원의 배열의 데이터가..
여러 자료를 담는 자료형이 필요하면? 대부분 리스트를 이용함. 하지만, 리스트는 값이 바뀔 위험이 있어. 아래처럼 코드 한 줄로 바뀌잖아. my_list = ['l', 'i', 's', 't'] my_list[1] = 'a' print(my_list) # ['l', 'a', 's', 't'] 그래서 값을 바꿀 수 없으면서도, 여러 자료를 담을 수 있는 자료형 -> 튜플을 사용하는 것. 튜플(Tuple) 튜플은 소괄호 ( )를 이용해서 표시. tuple_zero = () # 빈 튜플 tuple_one = (1,) # 이게 튜플인데 원소가 하나밖에 없는 것 뿐이야 라는 걸 알려주기 위해 , 표시 tuple = (1, 2, 3, 4, 5) tuple = 1, 2, 3, 4, 5 # 괄호로 안 묶고 나열해서 써..
리스트.pop(인덱스) : 인덱스로 원소 꺼내기. 원소를 꺼냈으니까 리스트에서는 꺼낸 원소는 없어짐. 괄호를 비우면, 마지막 원소를 뽑아냄. ※ 단, 존재하지 않는 인덱스를 pop할 경우 오류 발생 my_list = [1, 2, 3, 4, 5] print(my_list.pop(0)) # 1 출력 print(my_list.pop()) # 5 출력 시퀀스.count(원소) : 시퀀스 안에 있는 자료 원소?의 개수 세기. cf) 시퀀스? : 리스트, 튜플, range, 문자열처럼 값이 연속적으로 이어진 자료형을 시퀀스 자료형(sequence types)라고 부릅니다 my_seq = [2, 2, 2, 3, 4, 4] print(my_seq.count(2)) # 3 출력 쪼갤문자열.split(기준) : 문자열 -..