민서타 81

A/B Test, 이중차분법

1. A/B Test -A와 B를 대조하여 가설을 검정하는 실험법 -ex)배너위치 변경은 클릭전환율이 증가할 것이다 / 5%할인쿠폰보다 5천원 할인쿠폰이 주문이 더 많을 것 2. 이중차분법 -독립변수와 종속변수 간 인과효과를 측정하기 위한 인과 추론법(처치 전후 지표와 시계열 데이터 비교) 처치 전 처치 후 실험군 a A 대조군 b B 실험군: 실험자가 종속변수와 상관성이 높아 보이는 독립변수에 변화를 주는 그룹 대조군: 실험군과 대조하기 위해 처치를 하지 않는 그룹 이중차분: (A-a) - (B-b) 3. 개요 1)가설: 정액이 기재된 할인쿠폰의 주문 전환율이 더 높을 것이다 2)데이터 -종속변수: 주문전환율(1: 실험기간 중 주문이 1번이라도 있는 경우 / 0: 실험기간 중 주문이 없는 경우) -독립..

RS(3): Cold start

1. Cold start: 유저의 선호도나 행동에 대한 기록이 전혀 없을 때 유저에 대한 추천이 어려운 상황 -ex)신규 유저에게 어떤것을 추천할 지? 1. User 콜드 스타트: 새로운 유저가 플랫폼에 가입한 경우 추천 시스템이 사용자의 선호도, 과거 행동에 대한 충분한 정보X ex) 뉴비에게 어떤 게임을 추천할 지 2. Item 콜드 스타트: 새로운 아이템이 시스템/서비스에 추가되었을 때 해당 아이템에 대한 유저 데이터가 충분하지 않은 경우 ex) 상품 출시 시 누구에게 추천할 지? or 뉴스 추천 3. System 콜드 스타트: 추천 시스템을 처음 시작할 때 user 및 item 모두에 대한 상호 데이터가 전혀 없을 때 ex) 신규 출시 앱이 서비스 초반에 어떤 추천을 해줄 지 파레토 법칙: 80%..

RFM 분석

RFM: 고객 분류 기법 Recency: 얼마나 최근에 구매했는지 Frequency: 얼마나 자주 구매했는지 Monetary: 얼마만큼의 규모로 구매했는지 코드 구현: 1. 데이터: 1000명의 RFM 데이터 활용, is_back을 타깃으로한 로지스틱 회귀 모델 생성 2. 구간별 데이터 구분, 점수 환산 함수 생성, 상관계수를 곱해주는 RFM SCORE, TOTAL 피쳐 생성 3. TOTAL 함수를 구간화, 점수 산출(level col 생성) 4. level별 리텐션(1-리텐션) X = df.drop(['mem_no', 'last_ord_dt','is_back'], axis=1) y = df['is_back'] X_train, X_test, y_train, y_test = sklearn.model_sel..