본문 바로가기
TIL

내배캠 TIL 55일차

by ColorConeHead 2024. 4. 5.
반응형

클러스터링

팀에서 RFM 분류를 한 것과 
비교하기 위해 클러스터링을 진행했다

1) pca -> k-means
기존 컬럼들을 스캐일링 후 주성분 분석한 컬럼으로
클러스터링 하여 나온 라벨을 시각화하였다 


2) t-SNE
스탠다드 반에서 들었을 때,
로버스트하며 스캐일링이 없었던 것이 떠올라 이 또한 시각화하였다


생각보다 모양이 예쁘게 나오지 않았다

애초에 현실에서 자연스럽게 모이는 데이터는

예쁘게 나오기가 더 힘들 거 같기도 하다

EDA를 통해 클러스터링에서 나온 라벨링마다 특징을 잡아야 한다

 

 

 

EDA


팀내에서 RFM 분류를 한 것과
클러스터링에서 나온 라벨링 맴버십 별 특징을 보았다
R, F, M의 cut시 bins 를 정하는 것을 고심한 성과가 나온 것 같다
RFM 분류에서의 등급은 9개지만
클러스터링에서는 클러스터 수를 줄이는 방향도 생각 중이다
M에서의 평균 값이 전체 M에서의 max값과 비슷하거나
클러스터 내 데이터 수가 극단적인 것이 그 근거다
반응형

'TIL' 카테고리의 다른 글

내배캠 TIL 54일차  (0) 2024.04.04
내배캠 TIL 53일차  (1) 2024.04.01
내배캠 TIL 52일차  (0) 2024.03.29
내배캠 TIL 51일차  (0) 2024.03.28
내배캠 TIL 50일차  (0) 2024.03.27