250x250
반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- hadoop
- 공분산
- session 유지
- API
- subdag
- tensorflow text
- GenericGBQException
- flask
- Airflow
- GCP
- BigQuery
- spark udf
- 상관관계
- youtube data
- login crawling
- 유튜브 API
- gather_nd
- top_k
- XAI
- requests
- TensorFlow
- grad-cam
- Retry
- API Gateway
- Counterfactual Explanations
- airflow subdag
- integrated gradient
- UDF
- correlation
- chatGPT
Archives
- Today
- Total
데이터과학 삼학년
Precision (정밀도) / Recall (재현율) 어떤것을 메트릭으로 고를까?! 본문
반응형
불균형한 데이터를 평가할 때 precision과 recall 중 어느 것을 우선시해야 하는지는 문제의 특성과 목표에 따라 다름
Precision (정밀도)
- 정의: 모델이 양성으로 예측한 것 중 실제로 양성인 비율.
- 공식: Precision = TP / (TP + FP)
- 우선시해야 할 상황:
- *False Positive (위양성)**를 줄이는 것이 중요한 경우.
- 예를 들어, 스팸 필터링에서 스팸이 아닌 이메일을 스팸으로 분류하는 경우(정상 이메일이 스팸함으로 가는 경우)를 줄이고 싶을 때.
- 이상탐지 -> 모델의 이상탐지로 인해 유저 제재가 이루어졌을 경우, 크리티컬한 비즈니스 문제가 생길 수 있음(cs)
Recall (재현율)
- 정의: 실제 양성 중에서 모델이 양성으로 정확히 예측한 비율.
- 공식: Recall = TP / (TP + FN)
- 우선시해야 할 상황:
- *False Negative (위음성)**를 줄이는 것이 중요한 경우.
- 예를 들어, 질병 진단에서 실제로 질병이 있는 환자를 놓치는 경우를 줄이고 싶을 때.
- 상품 구입 의향자, 광고 추천(클릭율) 등에 실제로 사용할 법한 잠재 고객을 파악하는데 용이하게 쓰일 수 있음
F1 Score
- 정의: Precision과 Recall의 조화 평균.
- 공식: F1 Score = 2 * (Precision * Recall) / (Precision + Recall)
- 우선시해야 할 상황:
- Precision과 Recall 사이의 균형을 맞추고 싶을 때.
- 불균형한 데이터셋에서 모델의 전반적인 성능을 평가하고 싶을 때.
- F-beta score로 비즈니스 목적에 따라 precision, recall의 중요도 가중치를 매겨 평가 가능
결론
- Precision을 우선시해야 하는 경우: False Positive를 줄이는 것이 중요한 경우.
- Recall을 우선시해야 하는 경우: False Negative를 줄이는 것이 중요한 경우.
- F1 Score를 사용하는 경우: Precision과 Recall 사이의 균형을 맞추고 싶을 때.
728x90
반응형
LIST
'Machine Learning' 카테고리의 다른 글
TABNET (Attentive Interpretable Tabular Learning) (0) | 2024.04.29 |
---|---|
[tensorflow in spark] spark를 이용해 tf model을 분산 처리?! (0) | 2024.03.08 |
[sklearn in spark] spark분산환경을 이용한 모델 예측 (0) | 2024.03.07 |
[scikit-learn] 카테고리 변수 embedding endcoder 적용 (2) | 2024.02.29 |
ROC, Precision-Recall Curve for Multi classification (0) | 2024.02.20 |
Comments