티스토리 뷰

반응형

Chapter 9. 데이터에서 맨 처음 봐야 하는 것 Part3 - 분산과 표준편차(2)

분산

1. A 데이터만 일단 보자
   - 편차(거리)에 음수가 있어서 더해도 0만 나온다!
   - -를 +로 바꾸는 법 -> 절대값 OR 제곱
2. 거리제곱의 평균을 구하라
   - 제곱된 거리의 평균을 낸다 -> 이렇게 하면 양수만 나오기 때문에!
3. B 데이터도 구해보자
   - A의 편차제곱의 평균 = 2
   - B의 편차제곱의 평균 = 2.67
=> B가 더 벌어져 있다

분산(σ²)
  - 편차제곱의 평균
  - 분산(σ²) = ∑(X-μ)²/N
 - 데이터의 벌어진 정도를 비교할 수 있다

 

분산과 분포의 관계

분산이 크다 = 평균에 수렴하지 않는다
넓게 퍼져있는 모양

분산이 작다 = 평균에 수렴한다
뾰족한 모양

데이터 비교에는 문제가 없다
수치가 뻥튀기 되어있다
이 모든 원흉의 시작 : 제곱

표준편차
  - 표준편차(σ) = 루트{∑(X-μ)²/N}
  - Root를 씌워서 원상복구!

분산과 표준편차는 모두 데이터가 얼마나 벌어져 있는가를 확인하는 수치

 

정리

1. 분산 / 표준편차를 구하는 목적 : 데이터의 각 수치들이 평균에 수렴하는지, 아니면 넓게 흩어져 있는지 그 정도를 알려고 하는 것
2. 편차 : 평균에서 각 데이터까지의 거리(차)
3. 분산 : 편차제곱의 평균
4. 표준편차 : 분산의 제곱근(root)
5. 분산 / 표준편차와 데이터와의 관계
   - 분산 또는 표준편차가 크면 데이터는 평균에 수렴되지 않고 넓게 퍼져있는 형태
   - 분산 또는 표준편차가 작으면 데이터는 평균에 수렴

 

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함