일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- grad-cam
- gather_nd
- API Gateway
- 공분산
- BigQuery
- chatGPT
- top_k
- XAI
- login crawling
- 상관관계
- hadoop
- TensorFlow
- youtube data
- API
- correlation
- Retry
- subdag
- flask
- spark udf
- session 유지
- tensorflow text
- UDF
- integrated gradient
- requests
- GCP
- airflow subdag
- GenericGBQException
- Airflow
- 유튜브 API
- Counterfactual Explanations
- Today
- Total
데이터과학 삼학년
Accumulated Local Effects (ALE) Plot 본문
Accumulated Local Effects
- global surrogate로 각 데이터에 대한 해석이 아닌 모델에 대한 해석 방법
- 어떻게 feature가 모델의 예측결과에 영향을 미치는지 평균적으로 보는 방법
- PDP(Partial Dependance Plot)과 유사하지만, PDP는 feature간 상관관계가 있을때 해석이 어려운 단점을 가지고 있음
- 이를 보완한 것이 ALE라고 생각하면 됨
- ALE plot은 PDP보다 더 빠르고 편향되지 않은 대안
PDP(Partial Dependance Plot)의 한계
- PDP의 경우는 모델의 feature가 강한 상관관계가 있는 경우 partial feature의 의존도를 신뢰하기 어려운 문제가 있음
- 방의 갯수, 거실 크기를 이용해 집값을 예측하는 모델이 있다고하면, 이를 이용해 pdp를 그리면, 방의 갯수이든, 거실의 크기이던 거의 비슷한 형태의 plot을 띠게 되고, 결국 어떤 feature가 모델의 예측에 영향을 깊게 미치는지 알기 어려움
Feature간의 상관관계까지 고려해서 모델을 해석하려면 어떻게 해야하나?
pdp가 단순 평균이었다면, conditional distribution, 즉, 조건부 확률분포를 이용해서 평균을 구해 그릴 수 있음
모델의 예측 변화
부분 종속성 플롯 : “각 데이터 인스턴스가 값 v를 가질 때 모델이 평균적으로 예측하는 것을 보여 드리겠습니다. 그 기능을 위해. 나는 값 v가 모든 데이터 인스턴스에 대해 의미가 있는지 여부를 무시합니다.”
M-Plots : “해당 기능에 대해 v에 가까운 값을 가진 데이터 인스턴스에 대해 모델이 평균적으로 예측하는 것을 보여드리겠습니다. 그 효과는 해당 기능 때문일 수도 있지만 상관 관계가 있는 기능 때문일 수도 있습니다.”
ALE 도표 : "모델 예측이 해당 창의 데이터 인스턴스에 대해 v 주변 기능의 작은"창"에서 어떻게 변하는지 보여드리겠습니다."
참조
'Explainable AI' 카테고리의 다른 글
Grad-CAM (0) | 2023.03.24 |
---|---|
Feature Interaction (0) | 2022.12.21 |
LIME 결과 소수점 자리 핸들링 (0) | 2022.07.21 |
ICE (Individual conditional expectation) (0) | 2022.06.01 |
PDP (Partial Dependence Plot) (0) | 2022.05.28 |