Statistical Learning

선형 회귀 분석의 가정

Dan-k 2022. 5. 23. 19:14
반응형

선형회귀 분석을 사용하기 위해서는 4가지 가정을 충족해야 사용이 적절하다고 할 수 있음

선형성/독립성/등분산성/정규성

(1) 선형성 : 독립변수와 종속변수 사이에는 선형적인 관계를 띄어야 한다.
(2) 독립성 :  여러 변수들 간의 상관관계가 없이 독립이어야 한다. (다중공선성이 없어야함)
(3) 등분산성 : 잔차의 분산은 입력변수와 무관하게 일정해야 한다.
(4) 정규성 : 잔차가 평균이 0인 정규분포를 가진다.

 

1. 선형성(Linearity)

선형성이란, 독립변수와 종속변수 간에 선형적인 관계를 가지는 성질

종속변수(y)와 독립변수(x) 간에 직선의 형태를 띤 관계가 있을 것이라고 가정하고 거기에 선형의 추정 모형을 적합시키는 방법이기 때문에 y와 x간에 선형인 관계가 없다면 아무런 의미 없는 분석

2. 독립성 (Independency) 

독립성은, 주로 회귀 모형의 가장 빈번한 문제로 제기되는 다중공선성(Multicollinearity)과 관련

독립성이란, 다중 회귀 모형에 투입된 여러 변수들 간에 특정한 관계가 없는 성질

독립성 가정이 위배되면 회귀 계수의 분산이 비정상적으로 커져 계수 추정이 어려워지는 문제가 생깁니다.

 

3. 등분산성(homoskedasticity)

등분산 : 분산이 같다, 즉 잔차가 하나의 분산을 가지고 흩어져 있는 성질

 

4. 정규성(Normality)

잔차가 정규분포의 형태를 띤다

 

 

728x90
반응형
LIST