데이터 분석/추천시스템

RS(5): 잠재요인 분석, MF

민서타 2023. 12. 27. 11:40

1. Latent Factor Model

-부트스트랩을 통한 랜덤 중복추출 실행 시, train data에 속하지 않는 데이터

-같은 공간 안에 각각의 유저와 아이템을 뿌려놓고 그것들을 배치하여 거리(로스)값을 계산하여 비교, 학습

특이값분해(SVD): 이것과 저것 A(mxn)=U(mxm)* sigma(mxn) * V.T (nxn) /U: user 기반 latent factor, V.T: item 기반 latent Factor
 -데이터 차원 축소(노이즈 제거, Spase matrix 형태로 큰 데이터를 축소)
 -True rating - predicted rating: 근사값 추론, predicted rating을 활용해 sparse(빈 값)을 채우기 위한
 -SGD, ALS를 사용, Explicit, Implicit feedback를 MF에 녹여낼 수 있음

 

반응형