DevSSOM

머신러닝 - 자료의 형태 : 범주형 자료 본문

Data Science

머신러닝 - 자료의 형태 : 범주형 자료

데브쏨 2021. 8. 23. 01:39
반응형

자료의 형태가 중요한 이유?

머신러닝은 데이터라는 디지털 자료를 바탕으로 수행하는 분석 방식이기 때문에, 가장 먼저 해야될 게 '데이터가 어떻게 구성되어 있는지 확인'하는 것. 따라서, 자료의 형태를 파악하는 것은 필수.

 

 

자료 형태 구분

자료는 크게 수치형 자료와 범주형 자료로 나뉘고, 수치형 자료는 연속형 자료, 이산형 자료, 범주형 자료는 순위형 자료, 명목형 자료로 각각 나뉨. 

 

1) 수지형 자료

수치형 자료는 양적 자료(Quantitative data)라고도 불림. 말 그대로 수치로 측정이 가능한 자료임.
ex) 키, 몸무게, 시험 점수, 나이 등

2) 범주형 자료

범주형 자료는 질적 자료(Qualitative data)라고도 불림. 수치로 측정이 불가능한 자료를 의미.

ex) 성별, 지역, 혈액형 등

 

 

 

 

728x90
반응형
댓글