데이터과학 삼학년

Simpson's paradox (심슨의 역설) 본문

Statistical Learning

Simpson's paradox (심슨의 역설)

Dan-k 2023. 3. 4. 20:07
반응형

심슨의 역설

  • (Simpson's paradox)은 데이터의 세부 그룹별로 일정한 추세나 경향성이 나타나지만, 전체적으로 보면 그 추세가 사라지거나 반대 방향의 경향성을 나타내는 현상을 의미
  • 이 현상은 사회과학이나 의학 통계 연구에서 종종 발생

예시

치료법결석 크기 치료법 A 치료법 B 효과 비교

치료법결석 크기 치료법A 치료법B
작은 결석 그룹 1
93% (81/87)
그룹 2
87% (234/270)
큰 결석 그룹 3
73% (192/263)
그룹 4
69% (55/80)
모두 78% (273/350) 83% (289/350)

작은 결석과 큰 결석 모두에서 치료법 A의 성공률이 높게 나왔지만, 결석의 크기를 구분하지 않고 합친 경우에는 치료법 B의 성공률이 높은 결과가 나왔다.

이 사례에서는 결석의 크기라는 숨겨진 변수 또는 혼재변수가 각 치료법의 성공률에 영향을 미친 경우에 해당된다. 결석의 크기에 따라 성공률 자체가 달라지며, 결석의 크기 등과 같은 환자의 특성에 따라 선택하는 치료법이 달라진다는 것

 

 

참조

https://ko.wikipedia.org/wiki/심슨의_역설

728x90
반응형
LIST
Comments