티스토리 뷰

반응형

Chapter 10.  근데 이럴 때 Z는 못 쓰잖아? 그럼 대체자는? - t검증

현업에서 Z는 쓸 수 없다

Z = X-μ/σ
  - μ(모평균), σ(모표준편차) : 모집단의 데이터가 있어야 구할 수 있는 모수치!
  - Z를 쓰려면 모집단을 알아야 한다
  -> 현업에 없는 데이터

 

Z의 대체자, t

Z를 대체할 녀석
표본평균과 표본 표준편차는 구할 수 있습니까?
표본수치를 알면 Z를 추론 가능!

어떻게 표본수치를 이용해서 Z를 잘 추론할 수 있을까?
  - 랜덤 샘플링(N=100) -> 평균 = A
  - 랜덤 샘플링(N=100,000) -> 평균 = B
Q. A와 B 중 모집단 평균에 더 가까운 수치는? : B (샘플을 많이 뽑아줘서)

중심극한정리(CLT)
 : N이 충분하다면 
  - X는 μ에 근사한다
  - X바(표본의 평균, 표본평균) ≒ μ(모집단의 평균, 모평균)
  - S(표본의 표준편차, 표본표준편차) ≒ σ(모집단의 표준편차, 모표준편차)

Z = X-μ/σ   ->    X-X바/S = t
N이 많이면 t는 Z에 근사하게 된다!

t분포표
  - 인덱스(왼쪽 열) V : 자유도 = N-1  (if, N=30, 자유도=30-1=29)
  - 헤더(첫번째 행) α : 확률 기준점(반쪽 기준)
  - α는 통상적으로 0.05(5%) -> 양 극단이 있으니까 한쪽 극단으로 보면 0.025 -> 이때 수치가 1.96
  - α=0.025일 때, V가 커질수록(N이 많아질수록) 수치들이 작아짐. V=∞이면 값은 1.96
  => N이 30개가 넘었으면(충분하면) 정규화 해서 풀어라!

표본 수치로 Z 추론
실전에서 써 먹을 수 있는 t

 

정리

1. Z : 모수치를 수할 수 없기 때문에 현업에서 사용할 수 없음
2. t
  - 모수치가 아니라 표본수치를 이용하여 Z를 추론해볼 수 있음
  - 공식 : x - x바 / s
3. N이 많을 경우 : t와 Z는 같아짐 (t는 Z에 근사함)
   특히 N > 30인 경우 : t는 Z와 결과가 거의 같음

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함