본문 바로가기
반응형

분류 전체보기66

내배캠 TIL 52일차 EDA RFM에 추가할 수 있는 요소들을 나름대로 생각해보았다 1. 통상적으로 구매주기가 긴 카테고리에 대한 가중치 2. 구매횟수 대비 쿠폰 사용 빈도(낮을 수록 높은 등급) EDA에 진척이 없어서 데이터를 유저 ID를 기준으로 모수화시켜서 클러스터링을 먼저 한 후에 공통된 요소를 찾는 것도 방법이라고 생각한다 주성분분석 1. 정의 데이터의 특성을 최대한 보존하면서 차원을 축소하는 주성분을 찾아내는 방법. 주성분은 기존 변수(컬럼)들의 선형결합으로 만들어진다. 선형 결합 : c1 = a * x1 + b * x2 즉, 기존에 데이터 차원(feature)값을 결합하여 이 데이터를 잘 설명할 수 있는 새로운 종합점수를 만들어 보다 적은 차원으로 데이터를 설명하려는 방법. 2. 장단점 장점) 고차원의 데이터를 .. 2024. 3. 29.
내배캠 TIL 51일차 이론 1) RFM. 고객 평가, 고객 세그먼트 등에 사용할 수 있는 지표. 최근성(R), 구매빈도(F), 구매액(M)의 가중평균을 통한 고객의 평가. 혹은 각각의 수치에 따라서 고객을 세그먼트하는 기법. 모두가 우수한 고객은 vip. 모두가 저조한 고객은 저수익성 고객. 최근성은 떨어지지만 나머지 지표가 높은 고객은 이탈위험 고객군 등 고객 세그먼트의 지표가 된다. 우리가 가진 데이터에서는 상품 카테고리에 따라서 최근성과 구매빈도를 다르게 정의할 수 있을 듯 하다 통상적으로 구매주기가 긴 카테고리에 대해서는 구매빈도의 기준으로 다르게 적용하는 법을 고려중이다. 2. AARRR. 기업이 각 철자의 5가지 단계를 통해. 비즈니스에 직접적인 영향을 미칠 수 있는 지표에만. 집중할 수 있도록 한다. 1) Acq.. 2024. 3. 28.
내배캠 TIL 50일차 1. 프로젝트 프로젝트명 이커머스 고객 유형별 비즈니스 전략. 내용 클러스터링을 통한 이커머스 고객 유형 세분화. 고객 유형별 비즈니스 전략 제시. A/B 테스트를 통한 전략 실효성 검증. 한 줄 정리 이커머스 고객 유형별 분류 및 비즈니스 전략 수립. 프로젝트 핵심 기술 RFM, AARRR, 고객생애가치 분석. 클러스터링. 머신러닝, 시계열 예측. 태블로 대시보드. 프로젝트의 큰 뼈대를 정했다 다음은 필요한 개념들에 살을 붙이는 것이다. 2024. 3. 27.
내배캠 TIL 49일차 1. 5분 기록보드 5분 기록보드라는 개념에 대해 배웠디. 그날 활동을 요약하는 행위로 요약 시간이 5분이라서 5분 기록 보드 그날 한 일들을 되새기고 다음날 할 일들을 생각할 수 있어서 좋다 2. 분석 데이터 탐색 분석 데이터를 선정해야 한다 유저데이터를 해보고 싶은데 기존에 캐글이나 데이콘에서 얻기 보다는 크롤링이나 api를 통해 얻고 싶기 때문에 쉽지가 않다 1) 네이버 쇼핑 데이터 분석 2) 네이버 웹툰 데이터 분석 위 두 가지를 고려중이다 2024. 3. 26.
반응형