카파 통계량 (Kappa-statistics)

250x250

Notice

Recent Posts

Recent Comments

Link

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

데이터과학 삼학년

카파 통계량 (Kappa-statistics) 본문

Statistical Learning

카파 통계량 (Kappa-statistics)

Dan-k 2024. 2. 22. 10:00

카파 통계량

카파(Kappa) 통계량은 두 명 이상의 평가자(inter-rater) 간의 일치 정도를 측정하는 통계량
주로 분류 작업에서 사용되며, 각 평가자가 관측한 결과에 대한 일치 정도를 평가
특히, 다수의 평가자가 주어진 문제에서 얼마나 일치하는지를 확인하는 데에 유용

>> 모델의 평가에서 불균형이 심한 데이터에 대한 평가에 활용하면 좋다!!

- Kappa 통계량은 -1에서 1 사이의 값을 가짐

- 1에 가까울수록 모델의 예측이 완벽에 가깝다고 해석

- 0에 가까울수록 모델의 예측이 무작위 예측과 유사

카파 통계량의 정의

$$ [ \kappa = \frac{P_o - P_e}{1 - P_e} ] $$

여기서,

$ (P_o) $는 실제 관측된 일치도(Observered Agreement)
$ (P_e) $는 랜덤 기대 일치도(Random Expected Agreement)

계산 단계

오차 행렬 생성

다수의 평가자 간의 관측 결과를 오차 행렬로 정리

실제 관측된 일치도($ P_o $) 계산

$$ P_o = \frac{a + d}{a + b + c + d} $$

랜덤 기대 일치도($ P_e $) 계산

$$ P_e = \frac{(a + b) \times (a + c) + (c + d) \times (b + d)}{(a + b + c + d)^2} $$

카파($ \kappa $) 계산

$$ \kappa = \frac{P_o - P_e}{1 - P_e} $$

해석

카파 값이 0이라면, 랜덤한 일치 정도와 동일하다고 해석
카파 값이 1이라면, 완벽한 일치 정도를 의미
음수 값이 나오면, 실제보다 기대한 것보다 더 낮은 정도의 일치

https://ko.wikipedia.org/wiki/%EC%B9%B4%ED%8C%8C_%EC%83%81%EA%B4%80%EA%B3%84%EC%88%98

728x90

LIST

'Statistical Learning' 카테고리의 다른 글

범주형 변수와 연속형 변수간 상관관계(categorical numerical correlation) (0)	2023.09.25
SMOTENC :: oversampling with categorical variable (0)	2023.07.25
smoothing 기법 (0)	2023.07.11
pandas stratified sampling (층화표본) (0)	2023.06.08
구조방정식(SEM ; structural equation modeling) 파이썬 코드 (0)	2023.03.21

'Statistical Learning' Related Articles

Comments

데이터과학 삼학년

카파 통계량 (Kappa-statistics) 본문

카파 통계량 (Kappa-statistics)

'Statistical Learning' 카테고리의 다른 글

티스토리툴바