2021. 2. 2. 09:09ㆍ1. Data Analyst/1-0-1. Machine Learning
Supervised learning vs Unsupervised learning
지도학습 vs 비지도학습
지난 시간 머신러닝 알고리즘은 크게 4가지가 있고,
이 중 메인은 Supervised Learning(지도학습)과 Unsupervised Learning(비지도 학습)이라고 했다.
쉽게 생각하면
기계를 어떤 알고리즘으로 교육을 시키는가? 를 의미한다.
둘의 차이점을 시각화 한 그래프다.
지도학습은 라벨링된(명시적으로 구분되어 있는) 데이터를 학습하도록 하는 반면,
비지도학습은 아무 라벨링이 없거나, 모두 같은 라벨링 된
즉, 구분되지 않은 데이터를 던져주고 스스로 학습하여 Structure을 찾도록 한다.
자 그럼 비지도학습 알고리즘이 어떻게 Structure을 찾는가?
가장 대표적인 방법은 Clustering(군집화)이라는 것이다.
*Clustering : 서로 비슷한 특성을 지닌 변수들끼리 그룹화하는 방법
1-2. 지도학습 : Regression & Classification
회귀-연속적인 결과값 예측,
분류 - 불연속(이산)적인 결과값 예측
지도학습의 유형 두 가지인 1) Regression과 2) Classification 을 구분하는 것을
이해하기 위해 아래의 예를 준비해보았다.
Regression : A 사이즈의 종양이 악성일 가능성이 얼마나 될지 예상해 볼 수 있는가?
Classification : A 사이즈 종양은 악성(1)인가 양성(0)인가?
1-3. 비지도학습 : Clustering
엄청난 양의 데이터가 주어졌다고 가정했을 때, 클러스터링 할 수 있는 방법은 다양하다.
수명, 위치, 역할, 성별 등등 에 따라 그룹핑할 수 있다.
'1. Data Analyst > 1-0-1. Machine Learning' 카테고리의 다른 글
5. Gradient Descent Intution (0) | 2021.02.06 |
---|---|
4. Gradient Descent (0) | 2021.02.05 |
3. Cost Function(비용함수) (0) | 2021.02.04 |
2. How does Supervised Learning work? (0) | 2021.02.03 |
0. 머신러닝이란? (0) | 2021.02.01 |