티스토리 뷰

반응형

Chapter 9. 차이가 난다는 것의 기준은?(2) - 알파(α)와 p-value

기준선 α

대립가설(HA) : 월요일과 화요일의 매출에 차이가 있다.
0가설(H0) : 월요일과 화요일의 매출에 차이가 없다.
HA : μ1≠μ2 또는 μ1-μ2≠0
H0 : μ1=μ2 또는 μ1-μ2=0
H0=True일 확률을 따져야 함

0가설이 참일 확률이 너무 낮으면 0가설 기각
=> 대립가설이 참일 확률이 더 높다!

정확히 몇 %까지가 확률이 낮은 것인가?
기준이 필요

α = 0.05(5%)
0가설이 참일 확률이 5% 이하 -> 0가설 기각

 

실제 확률 값은? p-value

실제 데이터로 구해진 0가설이 참일 확률 : p-value(p) a.k.a 유의확률

α > p  ->  0.05 > p
  - 0가설이 참일 확률이 매우 낮다
  - 극단으로 감
  => 0가설 기각

 

까마귀는 까만 것인가?

까마귀는 까만색이다
- 100마리만 랜덤샘플링 했다고 가정 -> N=100
- 대립가설 HA : 까마귀 = Black
- 0가설 H0 : 까마귀 ≠ Black

- 100마리 중 4마리만 까만색이 아니라고 가정
- H0=True일 확률 = 4/100 = 0.04 (4%) -> p-value
- α = 0.05(5%)
- p가 기준(α)보다 낮은 확률이 나옴
  => 0가설 기각, 대립가설 채택
=> 까마귀는 까맣다

- 100마리 중 10마리만 까만색이 아니라고 가정
- H0=True일 확률 = 10/100 = 0.1 (10%) -> p-value
- α = 0.05(5%)
- p가 기준(α)보다 높은 확률이 나옴
  => 0가설 채택
=> 까마귀는 까맣지 않다 => 까마귀가 까맣다고 할 통계적 근거가 없다!

 

정리

1. 0가설 검정
  - 통계적 추론을 위한 0가설 검정을 하려면 0가설이 참일 확률과 그 확률의 기준선이 필요함
2. 기준선 α
  - 통상적으로 5%로 함, 즉 5%보다 낮으면 낮은 확률로 봄
3. p-value
  - 실제 샘플 데이터를 기반으로 0가설이 참일 확률을 구하는 것
  - α>p이면 0가설 기각이므로 우리의 추론이 맞음
  - α<p이면 0가설 기각 불가이므로 우리의 추론은 통계적으로 근거가 없는 것이 됨

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함