티스토리 뷰
[직딩잇템] 어서와 데이터는 처음이지 - Part3. 미래 예측을 위한 기초 개념: Chapter 6. 예측을 해보자(1) - 회귀, Data-fitting, Modeling
miiingo 2020. 4. 29. 10:31Chapter 6. 예측을 해보자(1) - 회귀, Data-fitting, Modeling
데이터 변화 패턴과 예측
입력값(input) : 예측에 이용할 값
출력값(output) : 예측해서 나오는 결과값
X로 Y를 예측
- 입력값 : X
- 출력값 : Y
Y = AX + B
- 입력값 : X
- 출력값 : Y
- 기울기 : A
- 절편 : B (= X가 0일 때 Y값)
Y = X
Y = 1X + 0
- 기울기 : 1
- 절편 : 0
Q. X가 10일 때 Y는? (패턴이 유지된다고 가정)
A. 10 (방정식으로 예측한 것)
X로 Y를 예측
데이터 간의 관계성을 기반
예측 = 데이터 간의 방정식 정의
상관 : 데이터 간의 변화 패턴으로 유사도(관계성)를 찾는 것
회귀 : 정의된 변화 패턴을 이용해서 데이터 간의 관계성을 가장 잘 나타내는 방정식을 찾는 것
상관 -> 회귀 (1+1으로 이해하는 게 좋음)
상관의 결과가 회귀 즉, 예측 모델의 정확성에 영향을 미침
Modeling & Data-fitting
회귀분석(Regression)
= Data-fitting
= Modeling
r=1, r=-1, r=0인 경우는 사실 현실에서 보기 어렵다!
r=0.7로 가정
X와 Y의 관계를 가장 잘 설명하는 단 하나의 선을 찾아내라
-> 쉬운 문제가 아님
정리
1. 상관과 회귀
- 서로 떨어진 별도의 분석이 아니라, 1+1임
- 상관의 결과가 당연히 회귀에 영향을 미침
2. 상관과 회귀의 목적
- 상관 : 데이터의 변화 패턴을 기반으로 한 유사도 계산
- 회귀 : 상관으로 구한 데이터 간의 관계성을 가장 잘 설명하는 방정식 도출
3. 회귀 = Data-fitting = Modeling
: 주어진 데이터의 관계성을 가장 잘 설명하는 방정식을 찾는다는 점에서 동일한 용어임
'교육 및 세미나' 카테고리의 다른 글
- Total
- Today
- Yesterday
- Hyperledger Fabric v1.1
- 블록 체인
- Blockchain
- 빅데이터 기초
- Hyperledger Fabric v1.2
- ambrosus
- 암브로셔스
- DOCs
- 코딜리티
- 블록체인
- javascript
- Hyperledger Indy
- 빅데이터 강의
- 알고리즘
- 기초 of 기초 데이터 개념
- 빅데이터
- 어서와 데이터는 처음이지
- codility
- 문제풀이
- 코테
- 하이퍼레저 페브릭
- 직딩잇템
- Private Data
- 빅데이터 교육
- ubuntu
- docker
- 하이퍼레저 인디
- 하이퍼레저 패브릭
- 코딩테스트
- Hyperledger Fabric
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |