티스토리 뷰
[직딩잇템] 어서와 데이터는 처음이지 - Part3. 미래 예측을 위한 기초 개념: Chapter 9. 아, 이제야 이해할 수 있다 - 회귀분석 vs. 머신러닝
miiingo 2020. 5. 8. 17:54Chapter 9. 아, 이제야 이해할 수 있다 - 회귀분석 vs. 머신러닝
전통적 회귀 방식
X = [1, 2, 3, 4, 5]
Y = [1, 2, 3, 4, 5]
X로 Y를 예측하는 모델
-> 단순선형회귀
=> Y = X
변화 패턴에 기반해서 최적의 방정식을 찾는 것
Y = AX + B
최적의 Parameter(A, B) 값을 찾는 것
MSE를 최소화하는 LMS(최소제곱법)
데이터가 각각 백만 개라면?
오차 제곱 평균(MSE)을 다 구해서 비교 (백만 개 전부..)
-> 너무 불편! 불가능!
Y = AX + B
- A = r·Sy/Sx
- B = Y바 - A·X바
- r : 상관계수
- x : 표준편차
- X바, Y바 : 평균
=> 이 공식을 이용하면 노가다 하지 않아도 공식으로 Parameter 구할 수 있다!
머신 러닝
머신 러닝의 목표
- 예측
- 분류
전통적인 회귀 = 머신 러닝 (목적은 똑같다)
전통적인 통계
- 최소제곱법 이용
- 공식을 이용
머신 러닝
- 최소제곱법 이용
- 기계로 직접 MSE를 일일이 계산
머신 러닝으로 모델링하는 과정
#1. Y = AX + B와 같은 학습 목표를 정해준다
#2. A, B에 랜덤으로 초기값을 주고 아무렇게나 선을 그리게 한다.
#3. MSE를 일일이 계산해가면서, 최적값을 찾도록 학습시킨다.
정리
1. 전통적인 회귀
- 최소 제곱법에 따른 최적의 선을 주어진 공식을 이용하여 구했음
- 공식 Y = AX + B에서
A = r·Sy/Sx
B = Y바 - A·X바
2. 머신 러닝
- 예측 모델을 만들 때 목적은 회귀와 완전히 동일함, 즉 모델의 Parameter를 찾는 것
- 사람이 유도한 공식을 쓰는 것이 아니라 스스로 노가다, 즉 '학습'을 통해 최적의 Parameter를 알아서 찾음
'교육 및 세미나' 카테고리의 다른 글
- Total
- Today
- Yesterday
- 하이퍼레저 페브릭
- javascript
- 빅데이터 교육
- 코딜리티
- codility
- ambrosus
- Private Data
- 하이퍼레저 패브릭
- 블록 체인
- 빅데이터 기초
- 문제풀이
- docker
- Hyperledger Fabric v1.2
- 빅데이터 강의
- Hyperledger Indy
- 직딩잇템
- Hyperledger Fabric
- 빅데이터
- Blockchain
- 알고리즘
- 코테
- 블록체인
- 암브로셔스
- Hyperledger Fabric v1.1
- ubuntu
- 코딩테스트
- 기초 of 기초 데이터 개념
- DOCs
- 하이퍼레저 인디
- 어서와 데이터는 처음이지
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |