티스토리 뷰
[직딩잇템] 어서와 데이터는 처음이지 - Part2. 효과 검증을 위한 기초 개념: Chapter 13. 데이터 분석 실습 - 연도별 매출 비교 미션 해결하기!
miiingo 2020. 4. 21. 10:05Chapter 13. 데이터 분석 실습 - 연도별 매출 비교 미션 해결하기!
0가설 정의/검증법 선택
목표 정의
월요일과 화요일의 평균 매출의 차이가 있는가?
샘플의 평균 차이 : 약 3만 정도
샘플의 차이 ≠ 모집단의 차이
0가설 : 월요일과 화요일의 매출 평균이 같다(내 추론과 반대)
H0 : μ1=μ2 (또는 μ1-μ2=0)
H0 : True일 확률 p는?
P가 α보다 낮으면 0가설이 참일 확률이 낮다
α = 0.05(5%) 기준
#조건간차이 #샘플 데이터 => t검증
엑셀 추가 기능 세팅법
엑셀 상단 메뉴(파일) > 옵션 > 추가기능 > '분석 도구' 클릭 > 'Excel 추가 기능' 이동 버튼 클릭 > '분석 도구'만 체크 후 확인 버튼 클릭 > 추가 기능 세팅 완료!
화면 상단의 데이터 탭을 누른 다음 제일 오른쪽에 '데이터 분석' 메뉴가 추가된 것을 확인
t검증을 위해 확인해야 할 것
#1. 정규성
모집단이 정상분포(정규분포)인가?
=> OK (가정)
#2. 독립성
화요일의 매출이 변한 게 월요일의 매출에 영향을 미치지 않는가?
=> OK (가정)
#3. 등분산성
월요일과 화요일의 분산이 같은가?
stdev 함수로 구할 수 있음
=> OK (가정)
데이터 분석
엑셀의 데이터 분석 메뉴 선택
t-검정: 쌍체비교
- 집단내설계
- 동일한 데이터
- 여러 조건 반복
t-검정: 등분산 가정 두집단
- 집단간설계
- 조건이 독립적(independent)
- 동일한 분석
t-검정: 이분산 가정 두집단
- 조건이 독립적(independent)
- 조건이, 분산이 같지 않은 경우
=> 여기서는 't-검정: 등분산 가정 두집단' 선택
변수 1 입력 범위 : 월요일 매출 전체
변수 2 입력 범위 : 화요일 매출 전체
가설 평균차 : 0
유의 수준 : 0.05 (α)
결과
조건 간 분산 차이가 크게 나지 않음
P(T<=t) 양측 검정 결과를 확인해야함!
p>α(0.05) : 0가설이 맞을 확률이 기준보다 높음
=> 평균 차이 없는게 맞다!
3개월 간 샘플 데이터 차이 (약 3만)
↓
통계적으로 미미한 차이
=> 월요일과 화요일의 매출의 평균 차이는 통계적으로 없다!
정리
1. 목표 정의 : 월요일과 화요일의 평균 매출의 차이가 있는가?
2. 0가설 정의 (월요일 평균 매출 = μ1, 화요일 평균 매출 = μ2)
- H0 : μ1 = μ2 (또는 μ1 - μ2 = 0)
- H0 = True일 확률 p를 구해서 기준(α=0.05)과 비교한다
- p<α이면 0가설이 참일 확률이 낮다(즉, 내 가설이 맞다)
3. 모집단의 조건 간 차이를 샘플 데이터로 검증해야 할 경우 t-검증을 선택한다
4. t-검증을 위해 확인해야 할 것 : 1) 정규성 2) 독립성 3) 등분산성
5. 엑셀 t-검증 종류
- t검정 : 쌍체비교 → 집단 내 설계
- t검정 : 등분산 가정 두집단 → 집단 간 설계 (조건 간 분산이 같을 경우)
- t검정 : 이분산 가정 두집단 → 집단 간 설계 (조건 간 분산이 다를 경우)
6. 결과 해석 : p>α이므로 0가설을 기각할 수 없다.
즉, 월요일과 화요일의 평균 매출은 통계적으로 차이가 없다
'교육 및 세미나' 카테고리의 다른 글
- Total
- Today
- Yesterday
- 코테
- 어서와 데이터는 처음이지
- 빅데이터 강의
- 코딩테스트
- 알고리즘
- 문제풀이
- codility
- 블록 체인
- 빅데이터 기초
- DOCs
- javascript
- ambrosus
- Hyperledger Fabric
- Blockchain
- Private Data
- Hyperledger Fabric v1.1
- 암브로셔스
- 하이퍼레저 인디
- ubuntu
- 하이퍼레저 패브릭
- 빅데이터
- 직딩잇템
- Hyperledger Indy
- 빅데이터 교육
- 하이퍼레저 페브릭
- 코딜리티
- docker
- 기초 of 기초 데이터 개념
- Hyperledger Fabric v1.2
- 블록체인
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |