DevSSOM
통계 기초 - 귀무가설, 대립가설, p값과의 관계 본문
반응형
$$ H_0: D_{A-B} = 0$$
$$ H_1: D_{A-B} \ne 0 \quad 또는 \quad H_a: D_{A-B} \ne 0 $$
\(H_0\) : 귀무가설
- \(H_0\)는 영어로 Null Hypothesis 의 약자. Null이란 비어있다, 아무것도 없다는 뜻. 우리말로 귀무가설.
- 즉, 無로 돌아가는 가설이라는 의미.
- 아무 영향도 없고, 아무 일도 없다 라는 것을 가정하는 가설 -> 이 가설이 맞다면 아무 일도 없을 거다!
- 귀무가설은 언제나 = 0 로 기억.
\(H_1\) 또는 \(H_a\) : 대립가설
- \(H_1\) 또는 \(H_a\) 는 영어로 Alternative Hypothesis의 약자. 우리말로 대립가설.
- 즉, 첫번째의 귀무가설을 대체하는 대립하는 가설이라는 말.
위의 두 개를 가지고 뭘 어쩌냐?
- 통계학자들은 가설을 먼저 정해 놓고, 그 다음 이 두 개의 가설 중 무엇이 맞을지 검정하는 작업을 함.
- 즉, 앞에서 살펴본 "어떤 사건이 우연히 일어날 확률"을 구할 때, p값을 사용하는데,
만약, 그 사건이 우연히 일어났다 라고 가정하는 것 = 귀무가설
그 사건이 우연히 일어난 것이 아니고 뭔가 이유(인과관계)가 있다 라고 가정하는 것 = 대립가설 - 이 두 가지 가설 중 어떤 것을 선택하느냐는 p값에 달려있음.
p값이 0.05보다 작다면 -> 대립가설을 선택
p값이 0.05보다 크다면 -> 귀무가설을 선택
통계적 가설과 검정
- 우리가 살면서 하는 연구나 실험이 항상 맞을 수는 없음. 이를 진실과 연구결과로 나누어 보면, 두 가지 종류의 오류가 가능함.
진실 | |||
\(H_0\)이 참 | \(H_0\)이 거짓 | ||
연구 결과 | \(H_0\)이 참 | 문제없음 | 2종 오류\((\beta)\) |
\(H_0\)이 거짓 | 1종 오류\((\alpha)\) | 문제없음 |
- 1종 오류 : 실제로는 참인데, 연구결과가 거짓이라고 나오는 경우
- 2종 오류 : 실제로는 거짓인데, 연구결과가 참이라고 나오는 경우
- 둘 중에 더 문제가 되는 것은 1종 오류. 실제로는 어떤 가설이 효과가 없는데, 효과가 있다고 하는게 더 심각한 문제를 일으킴.
- 여기서 말하는 1종 오류\((\alpha)\)의 기준이 5%이고, 이 5%가 p값의 기준이 된 것임.
- 즉, p값의 확률값 = 1종 오류의 수준을 5%로 제약한다는 의미
- 다르게 말하면, 어떤 사건이 우연히 발생했음에도 우연히 발생하지 않았다고 결론 내릴 오류를 5% 이내로 하겠다는 것.
- 하지만, 통계에 처음 접근할 때는 그냥 어떤 사건이 우연히 발생할 확률의 의미로 p값을 접근해도 무방. 이후에 통계를 이해하기가 너무 어렵기 때문에ㅠ
728x90
반응형
'공부 > 통계' 카테고리의 다른 글
통계 기초 - 상관관계 (0) | 2021.08.15 |
---|---|
통계 기초 - 변수와 데이터 (0) | 2021.08.14 |
통계 기초 - 유의수준 p값 (p-value) (0) | 2021.08.12 |
통계 기초 - 평균, 분산, 표준편차 (0) | 2021.08.10 |
댓글