데이터과학 삼학년

다중공선성 확인 및 처리 방법 본문

Machine Learning

다중공선성 확인 및 처리 방법

Dan-k 2023. 11. 6. 11:36
반응형

다중공선성 문제

- 션형회귀에서는 변수가 발산됨

 다중공선성 처리 방법

- 라쏘나 릿지, 일래스틱넷과 같이 정규항이 포함된 모델을 이용해 회귀 계수가 커지는 것을 억제하는 방법

- 다중공선성이 있는 feature 삭제

다중공선선 확인 방법

- 상관관계

- $VIF_i = \frac{1}{1-R^2_i}$ → 10 이상

- $\\{condition number} = {lambda_{\\{max}}} / {lambda_{\\{min}}}$ = 공분산 행렬의 최대 고유값 / 최소 고유값 비율 → 30이상이면 다중공선성이나 scaling 문제 의심

728x90
반응형
LIST
Comments