DevSSOM

통계 기초 - 귀무가설, 대립가설, p값과의 관계 본문

공부/통계

통계 기초 - 귀무가설, 대립가설, p값과의 관계

데브쏨 2021. 8. 13. 22:56
반응형

$$ H_0: D_{A-B} = 0$$

$$ H_1: D_{A-B} \ne 0  \quad 또는 \quad  H_a: D_{A-B} \ne 0 $$

 

\(H_0\) : 귀무가설

  • \(H_0\)는 영어로 Null Hypothesis 의 약자. Null이란 비어있다, 아무것도 없다는 뜻. 우리말로 귀무가설.
  • 즉, 無로 돌아가는 가설이라는 의미.
  • 아무 영향도 없고, 아무 일도 없다 라는 것을 가정하는 가설 -> 이 가설이 맞다면 아무 일도 없을 거다! 
  • 귀무가설은 언제나 = 0 로 기억.

\(H_1\) 또는 \(H_a\) : 대립가설

  • \(H_1\) 또는 \(H_a\) 는 영어로 Alternative Hypothesis의 약자. 우리말로 대립가설.
  • 즉, 첫번째의 귀무가설을 대체하는 대립하는 가설이라는 말.

 

위의 두 개를 가지고 뭘 어쩌냐?

  • 통계학자들은 가설을 먼저 정해 놓고, 그 다음 이 두 개의 가설 중 무엇이 맞을지 검정하는 작업을 함. 
  • 즉, 앞에서 살펴본 "어떤 사건이 우연히 일어날 확률"을 구할 때, p값을 사용하는데,
    만약,  그 사건이 우연히 일어났다 라고 가정하는 것 = 귀무가설
    그 사건이 우연히 일어난 것이 아니고 뭔가 이유(인과관계)가 있다 라고 가정하는 것 = 대립가설
  • 이 두 가지 가설 중 어떤 것을 선택하느냐는 p값에 달려있음.
    p값이 0.05보다 작다면 -> 대립가설을 선택
    p값이 0.05보다 크다면 -> 귀무가설을 선택

 

통계적 가설과 검정

  • 우리가 살면서 하는 연구나 실험이 항상 맞을 수는 없음. 이를 진실과 연구결과로 나누어 보면, 두 가지 종류의 오류가 가능함. 
  진실
\(H_0\)이 참 \(H_0\)이 거짓
연구 결과 \(H_0\)이 참 문제없음 2종 오류\((\beta)\)
\(H_0\)이 거짓 1종 오류\((\alpha)\) 문제없음

 

  • 1종 오류 : 실제로는 참인데, 연구결과가 거짓이라고 나오는 경우
  • 2종 오류 : 실제로는 거짓인데, 연구결과가 참이라고 나오는 경우
  • 둘 중에 더 문제가 되는 것은 1종 오류. 실제로는 어떤 가설이 효과가 없는데, 효과가 있다고 하는게 더 심각한 문제를 일으킴. 
  • 여기서 말하는 1종 오류\((\alpha)\)의 기준이 5%이고, 이 5%가 p값의 기준이 된 것임.
  • 즉, p값의 확률값 = 1종 오류의 수준을 5%로 제약한다는 의미
  • 다르게 말하면, 어떤 사건이 우연히 발생했음에도 우연히 발생하지 않았다고 결론 내릴 오류를 5% 이내로 하겠다는 것.
  • 하지만, 통계에 처음 접근할 때는 그냥 어떤 사건이 우연히 발생할 확률의 의미로 p값을 접근해도 무방. 이후에 통계를 이해하기가 너무 어렵기 때문에ㅠ
728x90
반응형

'공부 > 통계' 카테고리의 다른 글

통계 기초 - 상관관계  (0) 2021.08.15
통계 기초 - 변수와 데이터  (0) 2021.08.14
통계 기초 - 유의수준 p값 (p-value)  (0) 2021.08.12
통계 기초 - 평균, 분산, 표준편차  (0) 2021.08.10
댓글