카파 통계량 (Kappa-statistics)

250x250

Notice

Recent Posts

Recent Comments

Link

« 2025/06 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Tags more

Archives

Today

Total

관리 메뉴

데이터과학 삼학년

카파 통계량 (Kappa-statistics) 본문

Statistical Learning

카파 통계량 (Kappa-statistics)

Dan-k 2024. 2. 22. 10:00

카파 통계량
카파(Kappa) 통계량은 두 명 이상의 평가자(inter-rater) 간의 일치 정도를 측정하는 통계량
주로 분류 작업에서 사용되며, 각 평가자가 관측한 결과에 대한 일치 정도를 평가
특히, 다수의 평가자가 주어진 문제에서 얼마나 일치하는지를 확인하는 데에 유용
>> 모델의 평가에서 불균형이 심한 데이터에 대한 평가에 활용하면 좋다!!

- Kappa 통계량은 -1에서 1 사이의 값을 가짐
- 1에 가까울수록 모델의 예측이 완벽에 가깝다고 해석
- 0에 가까울수록 모델의 예측이 무작위 예측과 유사

카파 통계량의 정의
$$ [ \kappa = \frac{P_o - P_e}{1 - P_e} ] $$
여기서,

$ (P_o) $는 실제 관측된 일치도(Observered Agreement)
$ (P_e) $는 랜덤 기대 일치도(Random Expected Agreement)

계산 단계

오차 행렬 생성
다수의 평가자 간의 관측 결과를 오차 행렬로 정리

실제 관측된 일치도($ P_o $) 계산
$$ P_o = \frac{a + d}{a + b + c + d} $$

랜덤 기대 일치도($ P_e $) 계산
$$ P_e = \frac{(a + b) \times (a + c) + (c + d) \times (b + d)}{(a + b + c + d)^2} $$

카파($ \kappa $) 계산
$$ \kappa = \frac{P_o - P_e}{1 - P_e} $$

해석

카파 값이 0이라면, 랜덤한 일치 정도와 동일하다고 해석
카파 값이 1이라면, 완벽한 일치 정도를 의미
음수 값이 나오면, 실제가 랜덤한것보다 더 낮은 정도의 일치

https://ko.wikipedia.org/wiki/%EC%B9%B4%ED%8C%8C_%EC%83%81%EA%B4%80%EA%B3%84%EC%88%98

728x90

LIST

'Statistical Learning' 카테고리의 다른 글

네거티브 샘플링 (0)	2024.12.20
범주형 변수 상관관계?! -> cross tab with chi square (1)	2024.11.13
범주형 변수와 연속형 변수간 상관관계(categorical numerical correlation) (0)	2023.09.25
SMOTENC :: oversampling with categorical variable (0)	2023.07.25
smoothing 기법 (0)	2023.07.11

'Statistical Learning' Related Articles

Comments

데이터과학 삼학년

카파 통계량 (Kappa-statistics) 본문

카파 통계량 (Kappa-statistics)

'Statistical Learning' 카테고리의 다른 글

티스토리툴바