티스토리 뷰

반응형

Chapter 9. 아, 이제야 이해할 수 있다 - 회귀분석 vs. 머신러닝

전통적 회귀 방식

X = [1, 2, 3, 4, 5]
Y = [1, 2, 3, 4, 5]
X로 Y를 예측하는 모델
-> 단순선형회귀
=> Y = X

변화 패턴에 기반해서 최적의 방정식을 찾는 것
Y = AX + B
최적의 Parameter(A, B) 값을 찾는 것
MSE를 최소화하는 LMS(최소제곱법)

데이터가 각각 백만 개라면?
오차 제곱 평균(MSE)을 다 구해서 비교 (백만 개 전부..)
-> 너무 불편! 불가능!

Y = AX + B
  - A = r·Sy/Sx
  - B = Y바 - A·X바
  - r : 상관계수
  - x : 표준편차
  - X바, Y바 : 평균
=> 이 공식을 이용하면 노가다 하지 않아도 공식으로 Parameter 구할 수 있다!

 

머신 러닝

머신 러닝의 목표
  - 예측
  - 분류

전통적인 회귀 = 머신 러닝 (목적은 똑같다)

전통적인 통계
  - 최소제곱법 이용
  - 공식을 이용

머신 러닝
  - 최소제곱법 이용
  - 기계로 직접 MSE를 일일이 계산

머신 러닝으로 모델링하는 과정
#1. Y = AX + B와 같은 학습 목표를 정해준다
#2. A, B에 랜덤으로 초기값을 주고 아무렇게나 선을 그리게 한다.
#3. MSE를 일일이 계산해가면서, 최적값을 찾도록 학습시킨다.

 

정리

1. 전통적인 회귀
  - 최소 제곱법에 따른 최적의 선을 주어진 공식을 이용하여 구했음
  - 공식 Y = AX + B에서
      A = r·Sy/Sx
      B = Y바 - A·X바
2. 머신 러닝
  - 예측 모델을 만들 때 목적은 회귀와 완전히 동일함, 즉 모델의 Parameter를 찾는 것
  - 사람이 유도한 공식을 쓰는 것이 아니라 스스로 노가다, 즉 '학습'을 통해 최적의 Parameter를 알아서 찾음

 

 

반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함