[직딩잇템] 어서와 데이터는 처음이지 - 기초 of 기초 데이터 개념: Chapter 9. 데이터에서 맨 처음 봐야 하는 것 Part3

티스토리 뷰

교육 및 세미나

[직딩잇템] 어서와 데이터는 처음이지 - 기초 of 기초 데이터 개념: Chapter 9. 데이터에서 맨 처음 봐야 하는 것 Part3 - 분산과 표준편차(2)

miiingo 2020. 4. 6. 15:32

Chapter 9. 데이터에서 맨 처음 봐야 하는 것 Part3 - 분산과 표준편차(2)

분산

1. A 데이터만 일단 보자
   - 편차(거리)에 음수가 있어서 더해도 0만 나온다!
   - -를 +로 바꾸는 법 -> 절대값 OR 제곱
2. 거리제곱의 평균을 구하라
   - 제곱된 거리의 평균을 낸다 -> 이렇게 하면 양수만 나오기 때문에!
3. B 데이터도 구해보자
   - A의 편차제곱의 평균 = 2
   - B의 편차제곱의 평균 = 2.67
=> B가 더 벌어져 있다

분산(σ²)
  - 편차제곱의 평균
  - 분산(σ²) = ∑(X-μ)²/N
- 데이터의 벌어진 정도를 비교할 수 있다

분산과 분포의 관계

분산이 크다 = 평균에 수렴하지 않는다
넓게 퍼져있는 모양

분산이 작다 = 평균에 수렴한다
뾰족한 모양

데이터 비교에는 문제가 없다
수치가 뻥튀기 되어있다
이 모든 원흉의 시작 : 제곱

표준편차
- 표준편차(σ) = 루트{∑(X-μ)²/N}
- Root를 씌워서 원상복구!

분산과 표준편차는 모두 데이터가 얼마나 벌어져 있는가를 확인하는 수치

정리

1. 분산 / 표준편차를 구하는 목적 : 데이터의 각 수치들이 평균에 수렴하는지, 아니면 넓게 흩어져 있는지 그 정도를 알려고 하는 것
2. 편차 : 평균에서 각 데이터까지의 거리(차)
3. 분산 : 편차제곱의 평균
4. 표준편차 : 분산의 제곱근(root)
5. 분산 / 표준편차와 데이터와의 관계
- 분산 또는 표준편차가 크면 데이터는 평균에 수렴되지 않고 넓게 퍼져있는 형태
- 분산 또는 표준편차가 작으면 데이터는 평균에 수렴

저작자표시 비영리 동일조건 (새창열림)

'교육 및 세미나' 카테고리의 다른 글

[직딩잇템] 어서와 데이터는 처음이지 - 기초 of 기초 데이터 개념: Chapter 11. 데이터 분석 실습 Part1 - 데이터 확인과 기술 통계 (0)	2020.04.09
[직딩잇템] 어서와 데이터는 처음이지 - 기초 of 기초 데이터 개념: Chapter 10. 어디나 문제아는 있다 - 아웃라이어(outlier) (0)	2020.04.09
[직딩잇템] 어서와 데이터는 처음이지 - 기초 of 기초 데이터 개념: Chapter 8. 데이터에서 맨 처음 봐야 하는 것 Part3 - 분산과 표준편차(1) (0)	2020.04.06
[직딩잇템] 어서와 데이터는 처음이지 - 기초 of 기초 데이터 개념: Chapter 7. 데이터에서 맨 처음 봐야 하는 것 Part2 - 집중경향치 (0)	2020.04.06
[직딩잇템] 어서와 데이터는 처음이지 - 기초 of 기초 데이터 개념: Chapter 6. 데이터에서 맨 처음 봐야 하는 것 Part1 - 분포의 모양 (0)	2020.04.06

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

글 보관함

miiingo riiingo

티스토리 뷰