Statistical Learning
Simpson's paradox (심슨의 역설)
Dan-k
2023. 3. 4. 20:07
반응형
심슨의 역설
- (Simpson's paradox)은 데이터의 세부 그룹별로 일정한 추세나 경향성이 나타나지만, 전체적으로 보면 그 추세가 사라지거나 반대 방향의 경향성을 나타내는 현상을 의미
- 이 현상은 사회과학이나 의학 통계 연구에서 종종 발생
예시
치료법결석 크기 치료법 A 치료법 B 효과 비교
치료법결석 크기 | 치료법A | 치료법B |
작은 결석 | 그룹 1 93% (81/87) |
그룹 2 87% (234/270) |
큰 결석 | 그룹 3 73% (192/263) |
그룹 4 69% (55/80) |
모두 | 78% (273/350) | 83% (289/350) |
작은 결석과 큰 결석 모두에서 치료법 A의 성공률이 높게 나왔지만, 결석의 크기를 구분하지 않고 합친 경우에는 치료법 B의 성공률이 높은 결과가 나왔다.
이 사례에서는 결석의 크기라는 숨겨진 변수 또는 혼재변수가 각 치료법의 성공률에 영향을 미친 경우에 해당된다. 결석의 크기에 따라 성공률 자체가 달라지며, 결석의 크기 등과 같은 환자의 특성에 따라 선택하는 치료법이 달라진다는 것
참조
728x90
반응형
LIST