문돌이 존버/데이터 분석
2021. 8. 6.
(Explainable AI) Permutation Feature Importance 개념 및 실습
Permutation feature importance는 특성과 실제 결과값 간의 관계(연결고리)를 끊어내도록 특성들의 값을 랜덤하게 섞은 후 모델 예측치의 오류 증가량을 측정합니다. 만약 하나의 특성을 무작위로 섞었을 때 모델 오류가 증가한다면 모델이 예측할 때 해당 특성에 의존한다는 것을 의미하기 때문에 "중요한" 특성이라 할 수 있습니다. 반대로 오류에 차이가 없다면 그 특성은 "중요하지 않은" 특성이라고 할 수 있겠죠. 저는 permutation 과정을 "무작위로 섞는다"고 표현했는데, 다른 곳에선 이를 "각 특성을 제거하고 제거된 특성을 랜덤한 노이즈로 대체한다" 고 표현하기도 합니다. 무작위로 섞어 해당 특성과 결과값 간의 관계를 없앤다는 말과 동일하다는 점에서 어떤 표현을 쓰든 맥락은 같습니..