티스토리 뷰

반응형

Chapter 6. 예측을 해보자(1) - 회귀, Data-fitting, Modeling

데이터 변화 패턴과 예측

입력값(input) : 예측에 이용할 값
출력값(output) : 예측해서 나오는 결과값

X로  Y를 예측
  - 입력값 : X
  - 출력값 : Y

Y = AX + B
  - 입력값 : X
  - 출력값 : Y
  - 기울기 : A
  - 절편 : B (= X가 0일 때 Y값)

Y = X
Y = 1X + 0
  - 기울기 : 1
  - 절편 : 0

Q. X가 10일 때 Y는? (패턴이 유지된다고 가정)
A. 10 (방정식으로 예측한 것)

X로 Y를 예측
데이터 간의 관계성을 기반

예측 = 데이터 간의 방정식 정의

상관 : 데이터 간의 변화 패턴으로 유사도(관계성)를 찾는 것
회귀 : 정의된 변화 패턴을 이용해서 데이터 간의 관계성을 가장 잘 나타내는 방정식을 찾는 것
상관 -> 회귀 (1+1으로 이해하는 게 좋음)
상관의 결과가 회귀 즉, 예측 모델의 정확성에 영향을 미침

 

Modeling & Data-fitting

회귀분석(Regression)
= Data-fitting
= Modeling

r=1, r=-1, r=0인 경우는 사실 현실에서 보기 어렵다!

r=0.7로 가정
X와 Y의 관계를 가장 잘 설명하는 단 하나의 선을 찾아내라
-> 쉬운 문제가 아님

 

정리

1. 상관과 회귀
  - 서로 떨어진 별도의 분석이 아니라, 1+1임
  - 상관의 결과가 당연히 회귀에 영향을 미침
2. 상관과 회귀의 목적
  - 상관 : 데이터의 변화 패턴을 기반으로 한 유사도 계산
  - 회귀 : 상관으로 구한 데이터 간의 관계성을 가장 잘 설명하는 방정식 도출
3. 회귀 = Data-fitting = Modeling
  : 주어진 데이터의 관계성을 가장 잘 설명하는 방정식을 찾는다는 점에서 동일한 용어임

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함