데이터 분석/머신러닝

머신러닝(3): Global / Local Feature Importance Score

민서타 2023. 9. 21. 14:40

1. OOB(Out of Bag)

-부트스트랩을 통한 랜덤 중복추출 실행 시, train data에 속하지 않는 데이터

-OOB error는 부트스트랩에 포함되지 않은 데이터를 의사결정 나무를 통해 나온 예측값과 실제값의 차

 

2. Global VS Local:

Global: 종속변수 Y 전체, Y에 영향을 미치는 중요도
Local: 특정 종속변수 Y, 특정 종속변수 Y에 미치는 중요도

 

3. 목적:

 ★ 내가 원하는 데이터에 대한 특정 Y의 해석력을 얻기 위해서는 Black Box Model을 열어봐야함

Black box model: 내부 작업의 이해없이 입력과 결과의 측면으로 볼 수 있는 시스템(내부 작업은 명확하지 않음)

 

4. 설명 할 수 있는 방법(LIME, SHAP):

LIME(Local Interpretable Model-agnostic Explanation)

 

SHAP(Shapley Additive exPlanations)

게임이론에 따라 Y에 미치는 X's를 Shapley Value를 활용하여 중요도 계산

 

반응형