티스토리 뷰
교육 및 세미나
[직딩잇템] 어서와 데이터는 처음이지 - 기초 of 기초 데이터 개념: Chapter 6. 데이터에서 맨 처음 봐야 하는 것 Part1 - 분포의 모양
miiingo 2020. 4. 6. 15:27반응형
Chapter 6. 데이터에서 맨 처음 봐야 하는 것 Part1 - 분포의 모양
분포(distribution)
분포(distribution)
- 데이터의 대략적인 형태
- 분포는 '데이터는 대략적으로 어떻게 생겼는가?'를 알려준다!
히스토그램 : 구간별 데이터의 개수를 나타낸 막대그래프
정규분포(normal distribution)
정규분포(normal distribution) (a.k.a. 정상분포)
- 좌우대칭 종모양
- 평균을 중심으로 좌우대칭으로 데이터가 골고루 퍼져있는 형태
- 고르게 퍼져있는 데이터의 상태
편포
- 데이터가 한쪽으로 치우쳐져 있을 때의 분포
정규분포임을 확인하는 이유
데이터 모양이 정규분포라고 가정하고 풀어라
이유?
#1 전통적 통계분석 방법
- 모집단이 정산분포라고 가정하고 만들어졌다
#2 중심극한정리(CLT: Central Limit Theorem)
- N을 많이 뽑으면 모든 확률분포가 정규형태가 되고, 이때 표본의 평균은 모집단 평균을 따른다.
- N이 많으면 데이터는 자동으로 정규분포
정리
1. 정규분포 : 좌우대칭 종모양. 평균을 중심으로 데이터가 골고루 퍼져있는 형태
2. 편포 : 데이터가 한쪽으로 치우쳐져 있을 때의 분포
3. 데이터가 정상(정규분포)임을 확인하는 이유
- 분석 방법들의 통계적 가정
- 중심극한정리(CLT)
반응형
'교육 및 세미나' 카테고리의 다른 글
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 블록 체인
- ambrosus
- 하이퍼레저 패브릭
- javascript
- docker
- 하이퍼레저 인디
- 코테
- 문제풀이
- 빅데이터 강의
- Hyperledger Fabric v1.2
- codility
- 코딩테스트
- 하이퍼레저 페브릭
- 블록체인
- 빅데이터 교육
- Hyperledger Fabric v1.1
- 빅데이터
- 빅데이터 기초
- 어서와 데이터는 처음이지
- 코딜리티
- Hyperledger Indy
- Blockchain
- Hyperledger Fabric
- 암브로셔스
- 직딩잇템
- DOCs
- 기초 of 기초 데이터 개념
- ubuntu
- 알고리즘
- Private Data
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
글 보관함