Insight to Ptofitc [ing] Python_데이터 분석 | 클러스터링

[ing] Python_데이터 분석 | 클러스터링

2022. 2. 6. 14:071. Data Analyst/1-1. Python

728x90
반응형
  • 라이브러리 불러오기
  • 데이터 살펴보기

         - 경로설정 

         - 데이터 컬럼 종류 살피기

  • 데이터 정제하기 : Cleaning

        - 결측치 제거하기

         - 날짜 데이터 정제하기

         - 카테고리 데이터 정리하기 (카테고리 수 간단하게 줄임 + 유의미한 숫자로 바꿈)

         - Outlier 제거하기

  • 상관성 분석(분석,시각화_히트맵)
  • 데이터 전처리하기 : Preprocessing

         - 카테고리 데이터 전처리(LabelEncoder)_카테고리형 숫자형으로 변환

        - Scaling_피쳐 간 규모 맞추기

         - 차원축소_ 모델에 넣을 피쳐 

  • 세그먼트 나누기 : Clustering

         -  최적의 K값 찾기 - Elbow Method  

         - Clustering1_Hierarchical Clustering (KMeans)

  • 모델 평가하기 : Evaluation_데이터 EDA
  • 추가적인 Clustering 

         - Clustering2_Density Based Clustering (DBSCAN)

         - Clustering3_Partition Based Clustering  

 

  • 전체 모델 평가 - Silhouette Coefficient
728x90
반응형