데이터과학 삼학년

KS test (Kolmogorov–Smirnov test) 본문

Statistical Learning

KS test (Kolmogorov–Smirnov test)

Dan-k 2021. 5. 25. 20:27
반응형

KS test (Kolmogorov–Smirnov test)

- ks test는 non-parametric test 방법 (비모수적)

- 1개의 확률 분포를 검정하는 방버법과 두개의 샘플데이터를 검증하는 방법으로 나뉨

- 누적 확률분포(CDF)를 이용하여 표본의 확률 분포가 모집단의 확률 분포와 얼마나 유사한지를 비교하는 방법 or 두 표본의 누적 확률 분포 차이 비교

- ks statistics (ks 통계량)은 실제 데이터의 누적 확률 분포와 모집단의 누적 확률분포간의 차이를 거리로 산정한 통계

Kolmogorov–Smirnov statistic

- 기본 가정 : 독립(iid)

- ks statistic

  > F(X) : 모집단의 누적확률 함수

  > Fn(X) : 관찰한 샘플들의 누적확률 함수

  > ks statistic은 절대값으로 최소값은 0을 가짐

Kolmogorov distribution

[Kolmogorov PDF]

 

1) 1개의 표본 누적 확률 분포가 모집단의 확률분포 비교

 

[red: 모델의 CDF, blue: 표본의 CDF, black arrow: ks statistics]

 

2) 2개의 표본 누적 확률 분포 비교

[red: 1번 표본의 CDF, blue: 2번 표본의 CDF, black arrow: ks statistics]



 

https://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test

 

Kolmogorov–Smirnov test - Wikipedia

Kolmogorov–Smirnov test From Wikipedia, the free encyclopedia Jump to navigation Jump to search Non-parametric statistical test between two distributions Illustration of the Kolmogorov–Smirnov statistic. The red line is a model CDF, the blue line is an

en.wikipedia.org

 

728x90
반응형
LIST
Comments