반응형 TIL54 내배캠 TIL 51일차 이론 1) RFM. 고객 평가, 고객 세그먼트 등에 사용할 수 있는 지표. 최근성(R), 구매빈도(F), 구매액(M)의 가중평균을 통한 고객의 평가. 혹은 각각의 수치에 따라서 고객을 세그먼트하는 기법. 모두가 우수한 고객은 vip. 모두가 저조한 고객은 저수익성 고객. 최근성은 떨어지지만 나머지 지표가 높은 고객은 이탈위험 고객군 등 고객 세그먼트의 지표가 된다. 우리가 가진 데이터에서는 상품 카테고리에 따라서 최근성과 구매빈도를 다르게 정의할 수 있을 듯 하다 통상적으로 구매주기가 긴 카테고리에 대해서는 구매빈도의 기준으로 다르게 적용하는 법을 고려중이다. 2. AARRR. 기업이 각 철자의 5가지 단계를 통해. 비즈니스에 직접적인 영향을 미칠 수 있는 지표에만. 집중할 수 있도록 한다. 1) Acq.. 2024. 3. 28. 내배캠 TIL 50일차 1. 프로젝트 프로젝트명 이커머스 고객 유형별 비즈니스 전략. 내용 클러스터링을 통한 이커머스 고객 유형 세분화. 고객 유형별 비즈니스 전략 제시. A/B 테스트를 통한 전략 실효성 검증. 한 줄 정리 이커머스 고객 유형별 분류 및 비즈니스 전략 수립. 프로젝트 핵심 기술 RFM, AARRR, 고객생애가치 분석. 클러스터링. 머신러닝, 시계열 예측. 태블로 대시보드. 프로젝트의 큰 뼈대를 정했다 다음은 필요한 개념들에 살을 붙이는 것이다. 2024. 3. 27. 내배캠 TIL 49일차 1. 5분 기록보드 5분 기록보드라는 개념에 대해 배웠디. 그날 활동을 요약하는 행위로 요약 시간이 5분이라서 5분 기록 보드 그날 한 일들을 되새기고 다음날 할 일들을 생각할 수 있어서 좋다 2. 분석 데이터 탐색 분석 데이터를 선정해야 한다 유저데이터를 해보고 싶은데 기존에 캐글이나 데이콘에서 얻기 보다는 크롤링이나 api를 통해 얻고 싶기 때문에 쉽지가 않다 1) 네이버 쇼핑 데이터 분석 2) 네이버 웹툰 데이터 분석 위 두 가지를 고려중이다 2024. 3. 26. 내배캠 TIL 48일차 클러스터링 강의 1. 거리 1) 유클라디안 거리. - 통상적인 최단거리. 2) 맨해튼 거리. - 좌표 차의 합. 3) 민코프스키 거리. - 1), 2)를 결합하여 동시에 나타낸 것. 4) 코사인 거리. - 두 벡터 사이의 세타값에 따른 유사도를 구함. - 코사인 유사도(SIM) = 내적 / 두 벡터 의 크기의 곱. - 코사인 거리 = 1 - SIM 5) 자카드유사도. - 두 벡터의 성분에 대해 합집합에 대한 교집합의 비율. - 넘파이 모듈을 통해 계산할 때에는 사용되는 array의 크기가 같아야 한다 2. 벡터와 행렬의 연산. (1) np.dot. - 단순한 벡터(행렬)의 곱셈 연산. - 1차원 배열의 경우에는 broadcating이라는 법칙을 따름. - 다차원 배열(행렬)의 경우에는 행렬의 곱셈을 위한.. 2024. 3. 19. 이전 1 2 3 4 5 ··· 14 다음 반응형