[ing] Python_데이터 분석 | 클러스터링
2022. 2. 6. 14:07ㆍ1. Data Analyst/1-1. Python
728x90
반응형
- 라이브러리 불러오기
- 데이터 살펴보기
- 경로설정
- 데이터 컬럼 종류 살피기
- 데이터 정제하기 : Cleaning
- 결측치 제거하기
- 날짜 데이터 정제하기
- 카테고리 데이터 정리하기 (카테고리 수 간단하게 줄임 + 유의미한 숫자로 바꿈)
- Outlier 제거하기
- 상관성 분석(분석,시각화_히트맵)
- 데이터 전처리하기 : Preprocessing
- 카테고리 데이터 전처리(LabelEncoder)_카테고리형 숫자형으로 변환
- Scaling_피쳐 간 규모 맞추기
- 차원축소_ 모델에 넣을 피쳐
- 세그먼트 나누기 : Clustering
- 최적의 K값 찾기 - Elbow Method
- Clustering1_Hierarchical Clustering (KMeans)
- 모델 평가하기 : Evaluation_데이터 EDA
- 추가적인 Clustering
- Clustering2_Density Based Clustering (DBSCAN)
- Clustering3_Partition Based Clustering
- 전체 모델 평가 - Silhouette Coefficient
728x90
반응형