데이터과학 삼학년

SHAP 그래프 해석 본문

Explainable AI

SHAP 그래프 해석

Dan-k 2024. 1. 12. 12:00
반응형

SHAP을 활용한 기여도 시각화

- 의사결정 트리는 모델에 대한 해석이 쉽지만 많은 변수를 볼수 없고, 랜덤 포레스트는 모든 변수를 확인할 수는 있으나 feature 값이 커지면 결과의 변화정도를 알기 어려움

- 위와 같은 문제 해결을 위해 SHAP을 이용할 수 있음 (treeSHAP)

- 아래 결과는 SHAP summary_plot

- 세로축은 Feature importance 순서대로 나열

  • 가로축은 SHAP value(0)를 기준으로 왼쪽일 수록 음의 방향으로 기여, 오른쪽일수록 양의 방향으로 기여
  • feature의 값을 의미하는 색 : 파란색은 낮은값, 빨간색은 높은 값
    • 파란색이 왼쪽, 빨간색이 오른쪽으로 넓게 퍼져 있으면 feature값은 반응변수와 강한 양의 상관관계가 있고,
    • 반대면 음의 상관관계
    • 색이 섞여있거나 좌우로 좁게 퍼져있다면 해당변수는 반응변수에 크게 기여하지 않는다는 의미

[모델 해석]

  • 잔업(overtime)유무는 이직에 크게 기여하며 잔업을 하는 직종은 쉽게 이직
  • 월수입과 총 경력(근무 연수)의 순위가 높으며, 월수입이 낮은 사람과 근무 연수가 짧을수록 쉽게 이직하는 경향
  • 스톡옵션레벨 높음 → 스톡옵션이 없는 직원은 이직하기 쉬움
728x90
반응형
LIST

'Explainable AI' 카테고리의 다른 글

Counterfactual Explanations  (0) 2023.03.27
Grad-CAM  (0) 2023.03.24
Feature Interaction  (0) 2022.12.21
Accumulated Local Effects (ALE) Plot  (0) 2022.12.03
LIME 결과 소수점 자리 핸들링  (0) 2022.07.21
Comments