티스토리 뷰
[직딩잇템] 어서와 데이터는 처음이지 - Part2. 효과 검증을 위한 기초 개념: Chapter 2. 차이는 무엇으로 정의하냐고? - 확률로 접근하는 이유
miiingo 2020. 4. 17. 15:07Chapter 2. 차이는 무엇으로 정의하냐고? - 확률로 접근하는 이유
목표 확인
우리의 목표
: 월요일과 화요일의 평균 매출이 차이가 나는가?
기술통계
- 샘플 데이터의 특성만 알려줌
모집단 간 차이가 있는가?
-> 기술통계로 확인하긴 어려움
=> 모집단이 되어도 월요일과 화요일 매출 평균이 차이가 나는가?
샘플의 차이값으로 모집단의 차이값을 추론·유추해야함
추론을 하려면?
월요일과 화요일 모집단 평균 (실제로 가지고 있지 않은 데이터. 어딘가 있겠지...)
- 월요일의 모집단 평균 : μ1
- 화요일의 모집단 평균 : μ2
월요일과 화요일 샘플 평균 (내가 가지고 있는 데이터)
- 월요일의 모집단 평균 : X1바
- 화요일의 모집단 평균 : X2바
목표 : μ1 - μ2
현재 : X1바 - X2바
월요일 매출 모집단(μ1) -------표집(Sampling)------> 월요일 매출 표본(X1바)
화요일 매출 모집단(μ2) -------표집(Sampling)------> 화요일 매출 표본(X2바)
모집단 간 차이(μ1-μ2) <------------추론----------- 표본 간 차이(X1바-X2바)
추론의 정확성
추론
- 떄려 맞춘다
- 맞을 수도 있고 틀릴 수도 있다
그래도 가장 객관적이고 정확한 방법?
: 추론이 틀릴 확률 계산 (어려움)
추론이 틀릴 확률↑ -> 올바른 추론이 아님!
추론이 틀릴 확률↓ -> 정확하고 객관적인 추론!
정리
1. 기술 통계 : 3개월간의 데이터를 통해 구한 월요일과 화요일의 평균 차이일 뿐임
2. 추론/유추 : 샘플 데이터 간 차이로 앞으로 발생할 전체 데이터 간 차이를 유추, 추론해야 함
3. 추론의 정확성
- 추론이 틀릴 확률을 구해 추론의 정확성을 따짐
- 추론이 틀릴 확률이 낮다 = 정확도가 높은 추론이다
'교육 및 세미나' 카테고리의 다른 글
- Total
- Today
- Yesterday
- 빅데이터
- 코딩테스트
- 하이퍼레저 패브릭
- 기초 of 기초 데이터 개념
- javascript
- DOCs
- ubuntu
- ambrosus
- Hyperledger Fabric v1.2
- codility
- Hyperledger Fabric
- 코테
- 블록 체인
- 문제풀이
- 하이퍼레저 인디
- 직딩잇템
- Hyperledger Fabric v1.1
- Private Data
- 빅데이터 교육
- 블록체인
- docker
- Hyperledger Indy
- 빅데이터 강의
- 빅데이터 기초
- 코딜리티
- 어서와 데이터는 처음이지
- 암브로셔스
- 하이퍼레저 페브릭
- 알고리즘
- Blockchain
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |