데이터과학 삼학년

큰 수의 법칙, 중심극한의 정리 본문

Statistical Learning

큰 수의 법칙, 중심극한의 정리

Dan-k 2025. 3. 16. 18:13
반응형

1. 큰 수의 법칙(Law of Large Numbers, LLN)

큰 수의 법칙은 표본 크기가 커질수록 표본의 평균이 모집단의 평균에 가까워진다는 정리입니다.



✔️ 개념
• 표본 크기 n 이 커질수록 표본 평균 $ \bar{X} $은 모집단 평균 $ \mu $ 에 수렴
• 개별 표본 값이 변동성이 크더라도, 많은 데이터를 모으면 전체적인 경향이 모집단을 반영

✔️ 수식

표본 평균 $ \bar{X}n $ 은 모집단 평균 $ \mu $  에 확률적으로 수렴

\[
\lim_{n \to \infty} \bar{X}_n = \mu
\]

✔️ 예제

예를 들어, 동전을 던질 때 앞면이 나올 확률은 0.5입니다.
하지만 동전을 10번 던지면 앞면이 정확히 5번 나올 확률은 낮습니다.
그러나 1000번, 10000번 던질수록 앞면이 나오는 비율은 0.5에 가까워짐.


2. 중심극한정리(Central Limit Theorem, CLT)

중심극한정리는 표본의 크기가 충분히 크면, 모집단의 분포와 관계없이 표본평균의 분포가 정규분포를 따른다는 정리입니다.

✔️ 개념
• 모집단이 어떤 분포든지 상관없이, 충분히 큰 표본을 반복적으로 추출하면 표본 평균의 분포는 정규분포에 가까워짐
• 표본 크기가 커질수록 표본 평균의 분포가 평균 $ \mu $ , 분산 $ \sigma^2/n $   인 정규분포 $ N(\mu, \sigma^2/n) $  에 수렴

✔️ 수식

표본 평균 $ \bar{X} $  의 분포는
$$ \bar{X} \sim N\left( \mu, \frac{\sigma^2}{n} \right) $$단, n이 클 때

✔️ 예제

예를 들어, 주사위를 던지는 경우
• 주사위 하나의 숫자는 균등분포(Uniform Distribution)를 따름
• 하지만 주사위를 30번 던지고 평균을 구하면, 그 값들의 분포는 점점 정규분포에 가까워짐


3. 큰 수의 법칙 vs 중심극한정리 차이점

  큰 수의 법칙 (LLN)  중심극한정리 (CLT)
핵심 내용 표본 평균이 모집단 평균에 수렴 표본 평균의 분포가 정규분포에 가까워짐
목적 표본 크기가 커질수록 평균이 모집단의 평균과 같아짐을 보장 표본의 크기가 커질수록 분포 형태가 정규분포에 가까워짐을 보장
필요한 표본  크기 크면 클수록 좋음 대략 30개 이상이면 정규분포 근사 가능
적용 예시 동전을 1000번 던지면 앞면 비율이 0.5에 가까워짐  주사위를 30번씩 여러 번 던지면 평균값들이 정규분포를 따름


즉,
• 큰 수의 법칙은 “많이 하면 평균이 모집단과 같아진다”
• 중심극한정리는 “표본평균의 분포가 정규분포에 가까워진다”


728x90
반응형
LIST
Comments