문돌이 존버/데이터 분석
2021. 8. 20.
(Explainable AI) Accumulated Local Effects Plot 개념 이해하기
누적 지역 효과(Accumulated Local Effects, 이하 ALE)는 특성값이 머신러닝 모델의 예측에 평균적으로 얼마나 영향을 미쳤는지 설명합니다. ALE 그래프는 더 빠르고 덜 편향적으로 PDP를 대체할 수 있습니다. 동기와 직관적 이해 머신러닝 모델의 특성들이 상관관계를 가지고 있다면, PDP는 신뢰할 수 없습니다(이는 PDP를 설명할 때도 이야기한 내용). 다른 특성과 강한 상관관계를 가진 하나의 특성에 대해 PDP를 계산하려면 비현실적인 가공(artificial) 데이터 인스턴스의 평균 예측도 포함됩니다. 이는 추정된 특성값 효과를 크게 편향시킬 수 있습니다. 방 개수와 거실 크기에 따라 집값을 예측하는 머신러닝 모델의 PDP를 구한다고 가정해보죠. PDP를 구하는 단계는 아래와 같습니..