250x250
반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- UDF
- hadoop
- Counterfactual Explanations
- Retry
- airflow subdag
- GCP
- flask
- top_k
- BigQuery
- grad-cam
- correlation
- chatGPT
- gather_nd
- 유튜브 API
- GenericGBQException
- spark udf
- TensorFlow
- 공분산
- integrated gradient
- subdag
- 상관관계
- Airflow
- youtube data
- session 유지
- API Gateway
- API
- XAI
- requests
- login crawling
- tensorflow text
Archives
- Today
- Total
데이터과학 삼학년
분산분석 (ANOVA : ANalysis Of VAriance) 본문
반응형
ANOVA(분산분석)
- 3개 이상의 모집단(population)의 평균이 같은지 분석하는 가설검정 방법
- 기존 t-test는 2개의 모집단간 평균이 같은지 분석하는 가설검정이었다면, ANOVA는 3개 이상의 모집단에 대해 평균이 같은지 보는 것으로 one-way, two-way에 따라 다중 종속변수의 관계까지 고려할 수 있음
- F-statistics를 통해 가설검정 --> 정규분포의 제곱의 합은 카이제곱 분포 --> 카이제곱분포는 f통계량으로 분석(F = t-value^2)
- 통계량을 구하는 식 자체가 error인데 곧 분산과 같아서, 분산 분석이라는 표현 사용
ANOVA(분산분석) 개념
- 결국, level간 분산이 level내 분산보다 크다면 영가설을 기각시키는 것으로 생각하면 됨
- f-통계량이 크다는 건 모집단간 평균의 차이가 있음을 의미함
- SSA (between) > SSE (within)
>> 즉 표본간 평균의 차이와 표본내 평균과의 차이를 비교하는 방법으로 식 자체가 분산과 같음
Formula Used
Sums of squares Formula
Mean squares Formula
F Formula
반응형
ANOVA 매트릭스
참조
728x90
반응형
LIST
'Statistical Learning' 카테고리의 다른 글
통계적 편향 (통계로 거짓말하기) (0) | 2022.09.05 |
---|---|
이중차분법 (Difference In Difference) (0) | 2022.08.22 |
Chi-Square Distribution (카이제곱분포) (0) | 2022.06.03 |
선형 회귀 분석의 가정 (0) | 2022.05.23 |
Needleman-Wunsch algorithm(니들만-브니쉬(분쉬) 알고리즘) (0) | 2022.01.24 |
Comments