1. Data Analyst/1-0-1. Machine Learning
1. Supervised learning(지도학습) / Unsupervised learning(비지도 학습)
Data Analyst
2021. 2. 2. 09:09
728x90
반응형
Supervised learning vs Unsupervised learning
지도학습 vs 비지도학습
지난 시간 머신러닝 알고리즘은 크게 4가지가 있고,
이 중 메인은 Supervised Learning(지도학습)과 Unsupervised Learning(비지도 학습)이라고 했다.
쉽게 생각하면
기계를 어떤 알고리즘으로 교육을 시키는가? 를 의미한다.
둘의 차이점을 시각화 한 그래프다.
지도학습은 라벨링된(명시적으로 구분되어 있는) 데이터를 학습하도록 하는 반면,
비지도학습은 아무 라벨링이 없거나, 모두 같은 라벨링 된
즉, 구분되지 않은 데이터를 던져주고 스스로 학습하여 Structure을 찾도록 한다.
자 그럼 비지도학습 알고리즘이 어떻게 Structure을 찾는가?
가장 대표적인 방법은 Clustering(군집화)이라는 것이다.
*Clustering : 서로 비슷한 특성을 지닌 변수들끼리 그룹화하는 방법
1-2. 지도학습 : Regression & Classification
회귀-연속적인 결과값 예측,
분류 - 불연속(이산)적인 결과값 예측
지도학습의 유형 두 가지인 1) Regression과 2) Classification 을 구분하는 것을
이해하기 위해 아래의 예를 준비해보았다.
Regression : A 사이즈의 종양이 악성일 가능성이 얼마나 될지 예상해 볼 수 있는가?
Classification : A 사이즈 종양은 악성(1)인가 양성(0)인가?
1-3. 비지도학습 : Clustering
엄청난 양의 데이터가 주어졌다고 가정했을 때, 클러스터링 할 수 있는 방법은 다양하다.
수명, 위치, 역할, 성별 등등 에 따라 그룹핑할 수 있다.
728x90
반응형