[직딩잇템] 어서와 데이터는 처음이지 - Part3. 미래 예측을 위한 기초 개념: Chapter 6. 예측을 해보자(1)

티스토리 뷰

교육 및 세미나

[직딩잇템] 어서와 데이터는 처음이지 - Part3. 미래 예측을 위한 기초 개념: Chapter 6. 예측을 해보자(1) - 회귀, Data-fitting, Modeling

miiingo 2020. 4. 29. 10:31

Chapter 6. 예측을 해보자(1) - 회귀, Data-fitting, Modeling

데이터 변화 패턴과 예측

입력값(input) : 예측에 이용할 값
출력값(output) : 예측해서 나오는 결과값

X로  Y를 예측
  - 입력값 : X
  - 출력값 : Y

Y = AX + B
  - 입력값 : X
  - 출력값 : Y
  - 기울기 : A
  - 절편 : B (= X가 0일 때 Y값)

Y = X
Y = 1X + 0
  - 기울기 : 1
  - 절편 : 0

Q. X가 10일 때 Y는? (패턴이 유지된다고 가정)
A. 10 (방정식으로 예측한 것)

X로 Y를 예측
데이터 간의 관계성을 기반

예측 = 데이터 간의 방정식 정의

상관 : 데이터 간의 변화 패턴으로 유사도(관계성)를 찾는 것
회귀 : 정의된 변화 패턴을 이용해서 데이터 간의 관계성을 가장 잘 나타내는 방정식을 찾는 것
상관 -> 회귀 (1+1으로 이해하는 게 좋음)
상관의 결과가 회귀 즉, 예측 모델의 정확성에 영향을 미침

Modeling & Data-fitting

회귀분석(Regression)
= Data-fitting
= Modeling

r=1, r=-1, r=0인 경우는 사실 현실에서 보기 어렵다!

r=0.7로 가정
X와 Y의 관계를 가장 잘 설명하는 단 하나의 선을 찾아내라
-> 쉬운 문제가 아님

정리

1. 상관과 회귀
  - 서로 떨어진 별도의 분석이 아니라, 1+1임
  - 상관의 결과가 당연히 회귀에 영향을 미침
2. 상관과 회귀의 목적
  - 상관 : 데이터의 변화 패턴을 기반으로 한 유사도 계산
  - 회귀 : 상관으로 구한 데이터 간의 관계성을 가장 잘 설명하는 방정식 도출
3. 회귀 = Data-fitting = Modeling
  : 주어진 데이터의 관계성을 가장 잘 설명하는 방정식을 찾는다는 점에서 동일한 용어임

저작자표시 비영리 동일조건 (새창열림)

'교육 및 세미나' 카테고리의 다른 글

[직딩잇템] 어서와 데이터는 처음이지 - Part3. 미래 예측을 위한 기초 개념: Chapter 8. 예측을 해보자(3) - 회귀의 종류 (0)	2020.05.07
[직딩잇템] 어서와 데이터는 처음이지 - Part3. 미래 예측을 위한 기초 개념: Chapter 7. 예측을 해보자(2) - 최적의 선을 찾는 방법, 최소제곱법 (0)	2020.05.06
[직딩잇템] 어서와 데이터는 처음이지 - Part3. 미래 예측을 위한 기초 개념: Chapter 5. 오해하지 말자 결과는 결과일뿐! - 상관값의 해석 (0)	2020.04.28
[직딩잇템] 어서와 데이터는 처음이지 - Part3. 미래 예측을 위한 기초 개념: Chapter 4. 유사하다는 것은 무엇인가?(3) - 상관값에 따른 데이터의 관계성 (0)	2020.04.28
[직딩잇템] 어서와 데이터는 처음이지 - Part3. 미래 예측을 위한 기초 개념: Chapter 3. 유사하다는 것은 무엇인가?(2) - 데이터로 직접 확인하기 (0)	2020.04.24

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2026/02 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

글 보관함

miiingo riiingo

티스토리 뷰