문돌이 존버/데이터 분석
2021. 9. 16.
(Explainable AI) Counterfactual Explanations
반사실적 설명(Counterfactual Explanation) 반사실적 설명은 "X가 발생하지 않았다면 Y가 발생하지 않았을 것"이라는 형태로 인과관계를 설명합니다. 예를 들어, "내가 뜨거운 커피를 한 모금 마시지 않았더라면 혀가 데이지 않았을 텐데"와 같습니다. 사건 Y는 혀가 데인 것이고, 원인 X는 뜨거운 커피를 마셨다는 것입니다. 반사실적 사고를 위해선 관찰된 사실에 반하는 가상의 현실(예: 뜨거운 커피를 마시지 않은)을 상상해야 합니다. 반사실적 사고 능력은 다른 동물에 비해 인간을 똑똑한 존재로 만들어주죠. 해석가능한 머신러닝에서는 반사실적 설명이 개별 인스턴스의 예측에 대한 설명으로 사용됩니다. "사건"은 인스턴스의 예측된 결과값이고, "원인"은 모델의 입력값으로 사용되어 특정 결과를 "..