LTV, 로그 데이터 개념 1. LTV -고객 생애 가치(유저가 서비스를 사용하는 기간동안 창출하는 매출) -LTV = ARPU * 리텐션(ARPU = 유저당 주문금액(매출/유저 수, 그룹을 코호트로 쪼개여 LTV 비교 분석) 2. 로그 데이터 -고객이 서비스에 유입되어 남기는 행동 데이터, 유입, 노출, 클릭 등 데이터가 이벤트 단위로 적재 -활용사례: 서비스/프로덕트 개선, 고객 행동기반 데이터 분석 데이터 분석/분석기법 2023.12.16
코호트 분석 1. 코호트 분석 -코호트(특정 기간 동안 공통된 특성이나 경험을 갖는 사용자 집단으로 묶는 방안) -시간을 두고 비슷한 그룹을 비교 -목적: 고객의 이탈률, 리텐션(재구매율)을 파악하여 문제 진단 및 해결 전략 도출을 위한 대시보드로 사용 2. AARRR(해적지표) -사업의 핵심지표를 발굴하고, 성장시키는 방법을 찾는 활동(그로스 해킹) -1)사용자 유치 2)사용자 활성화 3)사용자 유지 4)추천 5)매출 3. 리텐션 -고객 유지율, 서비스의 성공을 예측할 수 있는 가장 기본적인 핵심지표 -측정방법: 특정 기간 내 이벤트를 발생시킨 유저의 비율 -기간 내 1번 이상의 이벤트 관측 = 한 번으로 카운트 -Retention = 측정 Week 기간 내 서비스 이용 고객수 / week1 서비스 이용 고객수 e.. 데이터 분석/분석기법 2023.12.10
A/B Test, 이중차분법 1. A/B Test -A와 B를 대조하여 가설을 검정하는 실험법 -ex)배너위치 변경은 클릭전환율이 증가할 것이다 / 5%할인쿠폰보다 5천원 할인쿠폰이 주문이 더 많을 것 2. 이중차분법 -독립변수와 종속변수 간 인과효과를 측정하기 위한 인과 추론법(처치 전후 지표와 시계열 데이터 비교) 처치 전 처치 후 실험군 a A 대조군 b B 실험군: 실험자가 종속변수와 상관성이 높아 보이는 독립변수에 변화를 주는 그룹 대조군: 실험군과 대조하기 위해 처치를 하지 않는 그룹 이중차분: (A-a) - (B-b) 3. 개요 1)가설: 정액이 기재된 할인쿠폰의 주문 전환율이 더 높을 것이다 2)데이터 -종속변수: 주문전환율(1: 실험기간 중 주문이 1번이라도 있는 경우 / 0: 실험기간 중 주문이 없는 경우) -독립.. 데이터 분석/분석기법 2023.12.04
RFM 분석 RFM: 고객 분류 기법 Recency: 얼마나 최근에 구매했는지 Frequency: 얼마나 자주 구매했는지 Monetary: 얼마만큼의 규모로 구매했는지 코드 구현: 1. 데이터: 1000명의 RFM 데이터 활용, is_back을 타깃으로한 로지스틱 회귀 모델 생성 2. 구간별 데이터 구분, 점수 환산 함수 생성, 상관계수를 곱해주는 RFM SCORE, TOTAL 피쳐 생성 3. TOTAL 함수를 구간화, 점수 산출(level col 생성) 4. level별 리텐션(1-리텐션) X = df.drop(['mem_no', 'last_ord_dt','is_back'], axis=1) y = df['is_back'] X_train, X_test, y_train, y_test = sklearn.model_sel.. 데이터 분석/분석기법 2023.11.28