티스토리 뷰
[직딩잇템] 어서와 데이터는 처음이지 - Part2. 효과 검증을 위한 기초 개념: Chapter 4. 국어와 수학 중 무엇을 더 잘한걸까? - 표준화와 표준점수
miiingo 2020. 4. 17. 15:12Chapter 4. 국어와 수학 중 무엇을 더 잘한걸까? - 표준화와 표준점수
다른 분포, 같은 점수
국어와 수학 둘 다 80점 맞았다
둘 중에 뭘 더 잘본거죠?
국어 점수 수학 점수
- 분포, 평균, 표준편차 다 다르다
- 똑같은 80점이 아니다!
국어와 수학의 분포는 어떻게 생겼을까?
- 국어와 수학 점수는 어떤 특성을 가지고 있을까?
- 국어는 그래도 대부분 잘하고
- 수학은 별의별 놈 다 있지 않을까요?
※ 알고 있어야할 내용
1. 분산/표준편차를 구하는 목적 : 데이터의 각 수치들이 평균에 수렴하는지, 아니면 넓게 흩어져 있는지 그 정도를 알려고 하는 것
2. 편차 : 평균에서 각 데이터까지의 거리(차)
3. 분산 : 편차제곱의 평균
4. 표준편차 : 분산의 제곱근(root)
5. 분산/표준편차와 데이터와의 관계
- 분산 또는 표준편차가 크면 데이터는 평균에 수렴되지 않고 넓게 퍼져있는 형태
- 분산 또는 표준편차가 작으면 데이터는 평균에 수렴
국어와 수학의 평균과 표준편차?
- 국어 : 평균 점수 어느 정도 나올듯. 편차도 작을 듯
- 수학 : 국어보다 평균 낮고 편차는 클 듯
우리 반 수학과 국어 점수 분포
- 국어 : 평균 70점, 표준편차 2
- 수학 : 평균 56점, 표준편차 5
80점이 평균에서 떨어진 거리를 구해서 비교?
- 국어의 (X-μ)=80-70=10
- 수학의 (X-μ)=80-56=24
- 수학이 더 멀리 떨어져있다
평균까지의 거리만 비교하면 될까?
-> 아직 부족!!
표준화
A : 나 지금 60km 갔음
B : 나도 지금 60km 갔음
-> A, B 중에 누가 더 빨리 갔을까?
단위를 시간으로 통일한다
- 속력 = 단위 시간 당 이동 거리
- A : 30분에 60km 갔음
- B : 1시간에 60km 갔음
거리를 각 분포의 표준 편차 단위로 통일
- Z = X-μ/σ
-> 표준 점수(Z-score) : 표준화 공식에 실제로 값을 집어넣어 얻어낸 값
- 표준화(Standardization)
- 국어의 표준 점수 : 80-70/2=5
- 수학의 표준 점수 : 80-56/5=4.8
=> 국어가 수학보다 평균에서 더 멀리 떨어져있다 = 국어가 더 잘했다!
정리
1. 표준화(standardization)
- 어떠한 특정 수치를 서로 다른 분포에서 비교하기 위해 편차를 표준 편차로 나눠서 표준 편차의 단위로 나타내는 것
- 기호로는 대문자 Z로 나타냄
2. 표준화 공식 : Z = X-μ/σ
3. 표준 점수(Z-score)
- 표준화 공식에 실제로 수치를 넣어서 구해낸 수치
- 표준 점수라 높을수록 평균으로부터 멀리 떨어져 있다는 의미
'교육 및 세미나' 카테고리의 다른 글
- Total
- Today
- Yesterday
- 블록체인
- Hyperledger Fabric v1.2
- 암브로셔스
- 빅데이터 교육
- 알고리즘
- javascript
- 문제풀이
- 빅데이터 강의
- DOCs
- 기초 of 기초 데이터 개념
- 빅데이터 기초
- 코테
- 빅데이터
- Hyperledger Fabric v1.1
- 하이퍼레저 패브릭
- 직딩잇템
- Hyperledger Fabric
- codility
- 하이퍼레저 페브릭
- ambrosus
- docker
- 코딩테스트
- Blockchain
- Private Data
- Hyperledger Indy
- 어서와 데이터는 처음이지
- 블록 체인
- ubuntu
- 하이퍼레저 인디
- 코딜리티
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |