Machine Learning
다중공선성 확인 및 처리 방법
Dan-k
2023. 11. 6. 11:36
반응형
다중공선성 문제
- 션형회귀에서는 변수가 발산됨
다중공선성 처리 방법
- 라쏘나 릿지, 일래스틱넷과 같이 정규항이 포함된 모델을 이용해 회귀 계수가 커지는 것을 억제하는 방법
- 다중공선성이 있는 feature 삭제
다중공선선 확인 방법
- 상관관계
- $VIF_i = \frac{1}{1-R^2_i}$ → 10 이상
- $\\{condition number} = {lambda_{\\{max}}} / {lambda_{\\{min}}}$ = 공분산 행렬의 최대 고유값 / 최소 고유값 비율 → 30이상이면 다중공선성이나 scaling 문제 의심
728x90
반응형
LIST