2021. 2. 4. 23:49ㆍ1. Data Analyst/1-0-1. Machine Learning
이 카테고리는 Standford Univ. Andrew Ng 교수님의 Machine-Learning 강의를 듣고
개인 복습을 위해 작성한 포스트 입니다.
앞서 우리는 xy좌표평면에 흩뿌려져 있는 train data set을 가장 잘 표현하는 직선을 그려
new data(x)의 y값을 예측하는 것, 우리는 이것을 회귀 라고 불렀다.
그렇다면 앞서 말한 data set을 대표하는 직선은 어떻게 그리는 것일까?
가장 대표적인 방법이 오늘 우리가 배울 비용함수(Cost Function)라는 것이다.
3-1. Cost Function(비용함수)
비용함수 (=오차함수의제곱, 평균제곱오차함수(MSE- Mean Square Error))
비용함수 사용시 주어진 데이터에 가장 가까운 일차함수 그래프를 알아낼 수 있다.
With this, we can measure the accuracy of our hypothesis function( h(x) )
---------------- 수학적 정의 ----------------
[가설] Hypothesis :
hθ(x) = θ0 + θ1x
Parameters:
θ0 , θ1
[비용] Cost Function:
Goal :
Minimize J (θ0 , θ1)
3-2. 두개의 중요한 함수 - 가설함수( h(x) ), 비용함수( J(θ1) )
- 가설 함수는 x의 함수이다.
- 비용 함수는 θ1의 함수이다.
- 비용 함수는 직선의 경사를 좌지우지 한다.
- 위의 예시는 가설함수의 변수가 각각 θ0 = 0, θ1 = 0.5일 때의 비용함수 값을 구하는 과정을 나타낸 것으로,
h(x) = 0.5x + 0
쉽게 나타내면 y = 0.5x 이다.
'1. Data Analyst > 1-0-1. Machine Learning' 카테고리의 다른 글
5. Gradient Descent Intution (0) | 2021.02.06 |
---|---|
4. Gradient Descent (0) | 2021.02.05 |
2. How does Supervised Learning work? (0) | 2021.02.03 |
1. Supervised learning(지도학습) / Unsupervised learning(비지도 학습) (0) | 2021.02.02 |
0. 머신러닝이란? (0) | 2021.02.01 |