파이썬 (쥬피터) [2021.04.22]/14일차

파이썬 14일차 - 머신러닝 개념정리(선형회귀)

영성 2021. 5. 14. 11:25

- 회귀에서 자주 사용하는 것 : 몸무게, 성적

회귀

- 현대 통계학을 이루는 큰 축

- 회귀 분석은 영국위 통계학자 갈톤(Galton)이 수행한 연구에서 유래

- 회귀분석은 테이터 값이 평균과 같은 일정한 값으로 돌아가련느 경향을 이용한 통계학 기법

 

 

 

- 중요 ----

- Linear Regression은 선형(직선)형태이므로 숫자 형태의 예측에 많이 사용된다

- Logistic Regression은 이진법 결과가 필요할 때 사용 실제로는 [ ∫ ] 이런 모양임  ex) 합격/불합격

- 이론 : X값에 대한 결과가 Y값이다 

- Y = W0 + W1 * X1  :  W1은 기울기   (핵심은 W값을 구하는 것이다) (미분, 편미분)

- 딥러닝의 파라미터 편집을 W값으로 사용한다

- 비선형 회귀는 딥러닝으로 많이 해결한다

- 다중 선형회귀 : X1값, X2값 (값이 상승하는데 영향을 주는 조건이 늘어남)

- RSS : 모든 오차들의 합

- #1주택가격(실제값) - (W0+W1*#1주택크기)(제곱)(예측값)

- W를 편미분 (W가 중요하다)

 

 

 

 

경사 하강법

-비용 최소화하기

- W(파라미터) 

- 최적 파라미터 : 가장 낮은 경사에 있는 W값

- W 값이 어떻게 변하냐에 따라서 오차값이 변한다

- 목표 : 오차값을 줄이는 것

- R(w) : 5차 함수

-  ∂ : round d

- η : 학습률 (업데이트 강도)

- 하이퍼 파라미터 : 사람이 임의로 값을 지정

- 파라미터 : 컴퓨터가 스스로 최적의 값을 찾음

- 경사 하강법은 W0와 W1을 구하는 식이다