[직딩잇템] 어서와 데이터는 처음이지 - Part2. 효과 검증을 위한 기초 개념: Chapter 6. 하나도 안 숨겨둔 비기 공개 - 계산 안하고 확률 구하는 법
Chapter 6. 하나도 안 숨겨둔 비기 공개 - 계산 안하고 확률 구하는 법
내 키는 상위 몇%?
우리나라 20세 이상 국민 중 내 키(180cm)는 상위 몇 %일까?
20세 이상 국민의 키 (가정)
- 평균(μ) = 173cm
- 표준 편차(σ) = 5
- 정상분포
확률 = 분포의 밑넓이
내 키는 상위 몇%? = 내 키~max 분포 밑넓이/20세 이상 키 분포 전체 밑넓이
표준정규분포로 바꾸면 적분 안써도 된다!
표준정규분포의 밑넓이
표준정규분포의 특징
- 평균 = 0
- 표준편차 = 1
- 전체 밑넓이 = 1
키 180cm를 표준정규분포로 바꾸면 어디에 위치할까?
- 표준점수 = 180-173/5 = 1.4
표준정규분포표
표준정규분포표(Z table)
- 표준정규분포의 밑넓이 수치들이 일일이 다 들어가 있는 표
- 인덱스(index) : 표준 점수(Z)의 소수 첫째 자리 (왼쪽 열)
- 헤더(header) : 표준 점수(Z)의 소수 둘쨰 자리 (위쪽 행)
- 수치 값의 의미 : Z가 x.xx일 때 분포의 밑넓이
원점에서부터 1.4까지일 때의 밑넓이 = 0.4192
-> 표준정규분포, 좌우대칭, 전체밑넓이=1 이므로, 표준점수가 1.4 이상인 부분의 밑넓이 = 0.5 - 0.4192 = 0.0808
=> 내 키~max 분포 밑넓이/20세 이상 키 분포 전체 밑넓이 = 0.0808 / 1 = 0.0808
=> 180cm는 약 상위 8%에 위치!
정리
1. 분포의 밑넓이 : 확률을 구하기 위한 분포의 밑넓이를 구하려면 표준화를 진행하여 표준 점수로 변경하고, 그 분포의 밑넓이를 구하면 됨
2. 표준정규분포표 : 표준화한 표준점수까지의 밑넓이는 별다른 수식 없이 표준정규분포표만 볼 줄 알면 구할 수 있음
3. 계산 안하고 확률 구하는 법 : 표준정규분포의 특성이 밑넓이가 1이고 좌우대칭이라는 점을 생각하면, 표준정규분포표에 나와 있지 않은 넓이도 구할 수 있음