문돌이 존버/데이터 분석
2021. 8. 9.
(Explainable AI) Partial Dependence Plot 개념 이해하기
PDP(Partial Dependence Plot)는 머신러닝 모델의 예측값에 대해 하나 혹은 두 개 특성의 한계 효과(marginal effect)를 나타내는 것입니다. 타겟과 특성 간의 관계가 선형(linear)인지, 단조 함수(monotonic)인지, 더 복잡한지 알 수 있습니다. 예를 들어, 선형 회귀 모델에 적용하면 PDP는 항상 선형 관계를 유지합니다. 회귀 모델의 부분 의존도 함수는 아래와 같이 정의됩니다. $\hat{f}_{x_s} = E_{x_c} [\hat{f} (x_s, x_c) ] = \int \hat{f} (x_s, x_c) d\mathbb{P} (x_c)$ 여기서 $x_s$는 부분 의존도 함수의 대상인 특성을 가리키고, $x_c$는 머신러닝 모델 $\hat{f}$에 사용된 다른 ..