DevSSOM

통계 기초 - 변수와 데이터 본문

공부/통계

통계 기초 - 변수와 데이터

데브쏨 2021. 8. 14. 23:36
반응형

변수(Variable)

  • 변수란 값이 변하는 숫자.
  • 변수의 반대말은 상수. 변하지 않고 항상 그대로 있는 숫자라는 뜻이니까.
  • 예시 1 :  회사에서 고객을 상대로 상품에 대한 만족도를 조사했을 때, 변수명은 '고객만족도'이고, 조사한 이 변수의 값은 고객마다 다르기 때문에 값이 변하니까 '변수'임.

  • 예시 2 :
  • '교육정도'라는 변수는 하위에 4가지 수준의 속성을 가지고 있음. 중졸/고졸/대졸/대졸이상. 물론 여기서 속성은 연구자의 의지에 따라 조금씩 바뀔 수는 있음.  
  • 이렇게 4가지의 속성을 그대로 가지고 분석하기는 어려움. 통계프로그램은 숫자만을 인식하고, 분석의 기초는 수학적인 것이기 때문에 각 속성에 값을 부여함.
  • 부여된 값들 사이에는 어떠한 관계가 있을 수도 있고, 없을 수도 있음.

 

변수의 종류

대부분의 경우, 이산/범주형 변수는 질적변수인 경우가 많고, 연속형 변수는 양적변수인 경우가 많다. 어떤 경우에는 이 둘을 섞어서 사용하기도 한다.

위에서 든 예시 1의 소비자의 고객만족도는 어떤 변수일까? -> 정답은 순위변수 Ordinal. 

1. 명목변수/척도

  • 각 범주(속성)간 순위가 없다.
  • 범주에 할당된 값은 범주 이름을 대신할 뿐, 의미가 없다.
  • 예를 들면, 성별 / 인종 / 혈액형 등.

2. 순위변수/척도

  • 각 범주(속성)간 순위가 있다.
  • 범주에 할당된 값은 범주 이름 뿐만 아니라, 순위를 나타낸다.
  • 하지만, 순위 사이에 등간성은 없다 (1과 2사이, 2와 3사이의 간격이 똑같지 x)
  • 예를 들면, 성적 / 학력 / 경제수준 / 리카르트 척도 등

3. 구간변수/척도

  • 측정된 범주 사이에 등간성이 있다.
  • 할당된 값은 임의 단위로서 비율이나 절대 '0'의 의미가 없다.
  • 덧셈은 가능하지만, 곱셈은 되지 않는다.
  • 예를 들면, 온도

4. 비율변수/척도

  • 측정된 범주 사이에 등간성이 있다.
  • 할당된 값은 임의 단위로서 비율과 절대 '0'의 의미가 있다.
  • 덧셈과 곱셈 모두 가능하다.
  • 예를 들면, 키 / 몸무게 / 나이 / 시간

 

 

 

 

728x90
반응형
댓글