티스토리 뷰

반응형

Chapter 2. 차이는 무엇으로 정의하냐고? - 확률로 접근하는 이유

목표 확인

우리의 목표
 : 월요일과 화요일의 평균 매출이 차이가 나는가?

기술통계
- 샘플 데이터의 특성만 알려줌

모집단 간 차이가 있는가?
-> 기술통계로 확인하긴 어려움

=> 모집단이 되어도 월요일과 화요일 매출 평균이 차이가 나는가?

샘플의 차이값으로 모집단의 차이값을 추론·유추해야함

 

추론을 하려면?

월요일과 화요일 모집단 평균 (실제로 가지고 있지 않은 데이터. 어딘가 있겠지...)
  - 월요일의 모집단 평균 : μ1
  - 화요일의 모집단 평균 : μ2

월요일과 화요일 샘플 평균 (내가 가지고 있는 데이터)
  - 월요일의 모집단 평균 : X1바
  - 화요일의 모집단 평균 : X2바

목표 : μ1 - μ2
현재 : X1바 - X2바

월요일 매출 모집단(μ1)  -------표집(Sampling)------> 월요일 매출 표본(X1바)
화요일 매출 모집단(μ2)  -------표집(Sampling)------> 화요일 매출 표본(X2바)
모집단 간 차이(μ1-μ2)  <------------추론----------- 표본 간 차이(X1바-X2바)

 

추론의 정확성

추론
  - 떄려 맞춘다
  - 맞을 수도 있고 틀릴 수도 있다

그래도 가장 객관적이고 정확한 방법?
: 추론이 틀릴 확률 계산 (어려움)

추론이 틀릴 확률↑ -> 올바른 추론이 아님!
추론이 틀릴 확률↓ -> 정확하고 객관적인 추론!

 

정리

1. 기술 통계 : 3개월간의 데이터를 통해 구한 월요일과 화요일의 평균 차이일 뿐임
2. 추론/유추 : 샘플 데이터 간 차이로 앞으로 발생할 전체 데이터 간 차이를 유추, 추론해야 함
3. 추론의 정확성
  - 추론이 틀릴 확률을 구해 추론의 정확성을 따짐
  - 추론이 틀릴 확률이 낮다 = 정확도가 높은 추론이다

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함