티스토리 뷰
[직딩잇템] 어서와 데이터는 처음이지 - Part2. 효과 검증을 위한 기초 개념: Chapter 9. 차이가 난다는 것의 기준은?(2) - 알파(α)와 p-value
miiingo 2020. 4. 21. 09:56Chapter 9. 차이가 난다는 것의 기준은?(2) - 알파(α)와 p-value
기준선 α
대립가설(HA) : 월요일과 화요일의 매출에 차이가 있다.
0가설(H0) : 월요일과 화요일의 매출에 차이가 없다.
HA : μ1≠μ2 또는 μ1-μ2≠0
H0 : μ1=μ2 또는 μ1-μ2=0
H0=True일 확률을 따져야 함
0가설이 참일 확률이 너무 낮으면 0가설 기각
=> 대립가설이 참일 확률이 더 높다!
정확히 몇 %까지가 확률이 낮은 것인가?
기준이 필요
α = 0.05(5%)
0가설이 참일 확률이 5% 이하 -> 0가설 기각
실제 확률 값은? p-value
실제 데이터로 구해진 0가설이 참일 확률 : p-value(p) a.k.a 유의확률
α > p -> 0.05 > p
- 0가설이 참일 확률이 매우 낮다
- 극단으로 감
=> 0가설 기각
까마귀는 까만 것인가?
까마귀는 까만색이다
- 100마리만 랜덤샘플링 했다고 가정 -> N=100
- 대립가설 HA : 까마귀 = Black
- 0가설 H0 : 까마귀 ≠ Black
- 100마리 중 4마리만 까만색이 아니라고 가정
- H0=True일 확률 = 4/100 = 0.04 (4%) -> p-value
- α = 0.05(5%)
- p가 기준(α)보다 낮은 확률이 나옴
=> 0가설 기각, 대립가설 채택
=> 까마귀는 까맣다
- 100마리 중 10마리만 까만색이 아니라고 가정
- H0=True일 확률 = 10/100 = 0.1 (10%) -> p-value
- α = 0.05(5%)
- p가 기준(α)보다 높은 확률이 나옴
=> 0가설 채택
=> 까마귀는 까맣지 않다 => 까마귀가 까맣다고 할 통계적 근거가 없다!
정리
1. 0가설 검정
- 통계적 추론을 위한 0가설 검정을 하려면 0가설이 참일 확률과 그 확률의 기준선이 필요함
2. 기준선 α
- 통상적으로 5%로 함, 즉 5%보다 낮으면 낮은 확률로 봄
3. p-value
- 실제 샘플 데이터를 기반으로 0가설이 참일 확률을 구하는 것
- α>p이면 0가설 기각이므로 우리의 추론이 맞음
- α<p이면 0가설 기각 불가이므로 우리의 추론은 통계적으로 근거가 없는 것이 됨
'교육 및 세미나' 카테고리의 다른 글
- Total
- Today
- Yesterday
- 하이퍼레저 페브릭
- 어서와 데이터는 처음이지
- 코딜리티
- docker
- 빅데이터 교육
- 하이퍼레저 패브릭
- 기초 of 기초 데이터 개념
- ambrosus
- Hyperledger Fabric v1.2
- Hyperledger Fabric
- Hyperledger Fabric v1.1
- 블록 체인
- Private Data
- 빅데이터 기초
- codility
- 알고리즘
- 코딩테스트
- 빅데이터
- 블록체인
- 암브로셔스
- 코테
- Blockchain
- DOCs
- 직딩잇템
- ubuntu
- 빅데이터 강의
- 하이퍼레저 인디
- javascript
- Hyperledger Indy
- 문제풀이
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |