티스토리 뷰

반응형

Chapter 13. 데이터 분석 실습 - 연도별 매출 비교 미션 해결하기!

0가설 정의/검증법 선택

목표 정의
월요일과 화요일의 평균 매출의 차이가 있는가?

샘플의 평균 차이 : 약 3만 정도
샘플의 차이 ≠ 모집단의 차이

0가설 : 월요일과 화요일의 매출 평균이 같다(내 추론과 반대)
H0 : μ1=μ2 (또는 μ1-μ2=0)
H0 : True일 확률 p는?
P가 α보다 낮으면 0가설이 참일 확률이 낮다
α = 0.05(5%) 기준

#조건간차이 #샘플 데이터 => t검증

 

엑셀 추가 기능 세팅법

엑셀 상단 메뉴(파일) > 옵션 > 추가기능 > '분석 도구' 클릭 > 'Excel 추가 기능' 이동 버튼 클릭 > '분석 도구'만 체크 후 확인 버튼 클릭 > 추가 기능 세팅 완료!

화면 상단의 데이터 탭을 누른 다음 제일 오른쪽에 '데이터 분석' 메뉴가 추가된 것을 확인

 

t검증을 위해 확인해야 할 것

#1. 정규성
모집단이 정상분포(정규분포)인가?
=> OK (가정)

#2. 독립성
화요일의 매출이 변한 게 월요일의 매출에 영향을 미치지 않는가?
=> OK (가정)

#3. 등분산성
월요일과 화요일의 분산이 같은가?
stdev 함수로 구할 수 있음
=> OK (가정)

 

데이터 분석

엑셀의 데이터 분석 메뉴 선택

t-검정: 쌍체비교
  - 집단내설계
  - 동일한 데이터
  - 여러 조건 반복
t-검정: 등분산 가정 두집단
  - 집단간설계
  - 조건이 독립적(independent)
  - 동일한 분석
t-검정: 이분산 가정 두집단
  - 조건이 독립적(independent)
  - 조건이, 분산이 같지 않은 경우
=> 여기서는 't-검정: 등분산 가정 두집단' 선택

변수 1 입력 범위 : 월요일 매출 전체
변수 2 입력 범위 : 화요일 매출 전체
가설 평균차 : 0
유의 수준 : 0.05 (α)

결과
조건 간 분산 차이가 크게 나지 않음
P(T<=t) 양측 검정 결과를 확인해야함!
p>α(0.05) : 0가설이 맞을 확률이 기준보다 높음
=> 평균 차이 없는게 맞다!

3개월 간 샘플 데이터 차이 (약 3만)
               ↓
통계적으로 미미한 차이

=> 월요일과 화요일의 매출의 평균 차이는 통계적으로 없다!

정리

1. 목표 정의 : 월요일과 화요일의 평균 매출의 차이가 있는가?
2. 0가설 정의 (월요일 평균 매출 = μ1, 화요일 평균 매출 = μ2)
  - H0 : μ1 = μ2 (또는 μ1 - μ2 = 0)
  - H0 = True일 확률 p를 구해서 기준(α=0.05)과 비교한다
  - p<α이면 0가설이 참일 확률이 낮다(즉, 내 가설이 맞다)
3. 모집단의 조건 간 차이를 샘플 데이터로 검증해야 할 경우 t-검증을 선택한다
4. t-검증을 위해 확인해야 할 것 : 1) 정규성  2) 독립성  3) 등분산성
5. 엑셀 t-검증 종류
  - t검정 : 쌍체비교 → 집단 내 설계
  - t검정 : 등분산 가정 두집단 → 집단 간 설계 (조건 간 분산이 같을 경우)
  - t검정 : 이분산 가정 두집단 → 집단 간 설계 (조건 간 분산이 다를 경우)
6. 결과 해석 : p>α이므로 0가설을 기각할 수 없다.
   즉, 월요일과 화요일의 평균 매출은 통계적으로 차이가 없다

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
글 보관함