티스토리 뷰
[직딩잇템] 어서와 데이터는 처음이지 - Part2. 효과 검증을 위한 기초 개념: Chapter 10. 근데 이럴 때 Z는 못 쓰잖아? 그럼 대체자는? - t검증
miiingo 2020. 4. 21. 09:58Chapter 10. 근데 이럴 때 Z는 못 쓰잖아? 그럼 대체자는? - t검증
현업에서 Z는 쓸 수 없다
Z = X-μ/σ
- μ(모평균), σ(모표준편차) : 모집단의 데이터가 있어야 구할 수 있는 모수치!
- Z를 쓰려면 모집단을 알아야 한다
-> 현업에 없는 데이터
Z의 대체자, t
Z를 대체할 녀석
표본평균과 표본 표준편차는 구할 수 있습니까?
표본수치를 알면 Z를 추론 가능!
어떻게 표본수치를 이용해서 Z를 잘 추론할 수 있을까?
- 랜덤 샘플링(N=100) -> 평균 = A
- 랜덤 샘플링(N=100,000) -> 평균 = B
Q. A와 B 중 모집단 평균에 더 가까운 수치는? : B (샘플을 많이 뽑아줘서)
중심극한정리(CLT)
: N이 충분하다면
- X는 μ에 근사한다
- X바(표본의 평균, 표본평균) ≒ μ(모집단의 평균, 모평균)
- S(표본의 표준편차, 표본표준편차) ≒ σ(모집단의 표준편차, 모표준편차)
Z = X-μ/σ -> X-X바/S = t
N이 많이면 t는 Z에 근사하게 된다!
t분포표
- 인덱스(왼쪽 열) V : 자유도 = N-1 (if, N=30, 자유도=30-1=29)
- 헤더(첫번째 행) α : 확률 기준점(반쪽 기준)
- α는 통상적으로 0.05(5%) -> 양 극단이 있으니까 한쪽 극단으로 보면 0.025 -> 이때 수치가 1.96
- α=0.025일 때, V가 커질수록(N이 많아질수록) 수치들이 작아짐. V=∞이면 값은 1.96
=> N이 30개가 넘었으면(충분하면) 정규화 해서 풀어라!
표본 수치로 Z 추론
실전에서 써 먹을 수 있는 t
정리
1. Z : 모수치를 수할 수 없기 때문에 현업에서 사용할 수 없음
2. t
- 모수치가 아니라 표본수치를 이용하여 Z를 추론해볼 수 있음
- 공식 : x - x바 / s
3. N이 많을 경우 : t와 Z는 같아짐 (t는 Z에 근사함)
특히 N > 30인 경우 : t는 Z와 결과가 거의 같음
'교육 및 세미나' 카테고리의 다른 글
- Total
- Today
- Yesterday
- codility
- 문제풀이
- 빅데이터 기초
- 블록 체인
- 기초 of 기초 데이터 개념
- docker
- 하이퍼레저 페브릭
- ambrosus
- ubuntu
- 알고리즘
- Private Data
- javascript
- Hyperledger Fabric v1.2
- 하이퍼레저 패브릭
- DOCs
- 빅데이터
- 블록체인
- Hyperledger Fabric v1.1
- 직딩잇템
- Hyperledger Indy
- 하이퍼레저 인디
- Blockchain
- 코테
- 어서와 데이터는 처음이지
- 빅데이터 강의
- 빅데이터 교육
- 코딜리티
- 코딩테스트
- Hyperledger Fabric
- 암브로셔스
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |