티스토리 뷰

반응형

Chapter 6. 데이터에서 맨 처음 봐야 하는 것 Part1 - 분포의 모양

분포(distribution)

분포(distribution)
  - 데이터의 대략적인 형태
  - 분포는 '데이터는 대략적으로 어떻게 생겼는가?'를 알려준다!

히스토그램 : 구간별 데이터의 개수를 나타낸 막대그래프

 

정규분포(normal distribution)

정규분포(normal distribution) (a.k.a. 정상분포)
  - 좌우대칭 종모양
  - 평균을 중심으로 좌우대칭으로 데이터가 골고루 퍼져있는 형태
  - 고르게 퍼져있는 데이터의 상태

편포
  - 데이터가 한쪽으로 치우쳐져 있을 때의 분포

 

정규분포임을 확인하는 이유

데이터 모양이 정규분포라고 가정하고 풀어라

이유?
#1 전통적 통계분석 방법
  - 모집단이 정산분포라고 가정하고 만들어졌다
#2 중심극한정리(CLT: Central Limit Theorem)
  - N을 많이 뽑으면 모든 확률분포가 정규형태가 되고, 이때 표본의 평균은 모집단 평균을 따른다.
  - N이 많으면 데이터는 자동으로 정규분포

 

정리

1. 정규분포 : 좌우대칭 종모양. 평균을 중심으로 데이터가 골고루 퍼져있는 형태
2. 편포 : 데이터가 한쪽으로 치우쳐져 있을 때의 분포
3. 데이터가 정상(정규분포)임을 확인하는 이유
   - 분석 방법들의 통계적 가정
   - 중심극한정리(CLT)

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
글 보관함