일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- TensorFlow
- subdag
- Retry
- Airflow
- flask
- API
- integrated gradient
- session 유지
- Counterfactual Explanations
- GCP
- requests
- hadoop
- correlation
- 유튜브 API
- tensorflow text
- 공분산
- login crawling
- BigQuery
- chatGPT
- XAI
- API Gateway
- airflow subdag
- 상관관계
- GenericGBQException
- spark udf
- UDF
- top_k
- gather_nd
- youtube data
- grad-cam
- Today
- Total
데이터과학 삼학년
[기초통계] 1종 오류와 2종 오류 본문
통계의 대표적 가정인
귀무가설 (null hypothesis) 와 대립가설 (alternative hypothesis) 채택사이에서 발생하게 되는 오류의 유형을
1종 오류, 2종 오류로 나눠놓았다.
1종 오류와 2종 오류를 예시를 통해 알아보자.
오류 |
가설검정 또는 표본조사 |
1종 오류 |
귀무가설이 참인데 기각하고 대립가설 채택 |
2종 오류 |
귀무가설이 거짓인데 채택하고 대립가설 기각 |
오류 |
위험 |
설명 |
1종 오류 (Type I error) |
알파 위험 (α risk) |
잘못된 부적정 의견을 표명하는 오류 기각(Rejection)의 오류 과소신뢰의 오류 비효율적 감사(피감사인의 요청에 따라 재감사를 통해 오류가 정정될 것임) |
2종 오류 (Type II error) |
베타 위험 (β risk) |
잘못된 적정 의견을 표명하는 오류 채택(Acceptance)의 오류 과대신뢰의 오류 비효과적 감사(피감사인은 침묵하며 오류는 존속하게 될 것임) |
검토(Review)/감사(audit) 서비스 분야
가설검정(Hypothesis test)
다양한 분야에서 실험이나 테스트를 통해 특정한 주장이나 이론을 증명하거나 부정하는 경우가 자주 있습니다.
이때 기존에 지지 받는 통념이나 주장을 귀무가설(H0), 이에 도전하는 새로운 주장을 대립가설(H1)이라고 합니다.
가설검정은 일반적으로 통계학 이론에 근거하여 이루어지는데 어떤 통계학 분포를 사용했느냐에 따라 z-test, t-test, 카이자승 테스트 등으로 불립니다.
>> 가설에 사용한 통계분포에 따라 검정방법이 다름 (z, t, 카이제곱 테스트 등)
한편 대부분의 실험이나 테스트는 전수검사가 아니라 표본검사에 기반을 두기 때문에 잘못된 결론을 내리는 오류가 발생할 수 있는데 오류의 유형을 정리하면 다음과 같습니다.
한편 샘플링 오류를 1종 오류와 2종 오류로 구분하는 방법은 감사오류를 1종 오류와 2종 오류로 나누는 것과 유사합니다.
다만 적용되는 분야가 다를 뿐인데 이를 정리하면 다음과 같습니다.
인력채용오류
1종 오류와 2종 오류의 개념은 인력채용 실무에서도 적용 가능합니다.
각각은 모집 중인 직위(position)에 적합한 직원을 채용하지 않거나, 적합하지 않은 직원을 채용하는 오류에 해당하는데 정리하면 다음과 같습니다.
한편 인력채용 실무에서는 1종 오류가 비효과적인 실무이고, 2종 오류가 비효율적인 실무입니다.
그 이유는 적합한 직원을 뽑지 않는 오류(1종)가 발생하면 채용목적이 달성되지 못한 것이므로 비효과적인 실무라는 것입니다.
이에 비해 2종 오류가 발생하면 채용한 직원을 사용해 본 다음, 그가 직위에 적합하지 않음을 알게 될 수 있으며, 교육과 훈련 등을 통해 부족한 능력을 보충하도록 도와 주거나 적합한 직원을 뽑을 때까지 채용과정을 반복해야 할 수 있습니다.
따라서 추가적인 자원투자나 시간소비가 발생할 수 있기 때문에 비효율적인 실무로 간주하는 것입니다.
오류 |
검토/감사 |
인력채용 |
1종 오류 |
비효율적 감사 |
비효과적 채용실무 |
2종 오류 |
비효과적 감사 |
비효율적 채용실무 |
시약검사오류
의약분야에서는 질병감염여부 또는 임신여부 등을 판정하기 위해 다양한 시약검사를 합니다.
이때 질병에 감염되지 않았거나 임신이 아닌 경우는 정상적인 또는 일상적인 상황으로 간주합니다.
그리고 시약검사결과는 음성(-)반응이 나타나야 다시 말해 아무런 반응이 없어야 합니다.
이에 비해 질병에 감염되었거나 임신되었다면 비정상적인 또는 비일상적인 상황이 발생한 것입니다.
그리고 시약검사결과는 양성(+)반응, 다시 말해 무언가 독특한 예외적 반응이 나타나야 합니다.
정리하자면 각각의 반응은 다음과 같은 의미를 가집니다.
반응 |
질병검사 |
임신검사 |
음성(-) |
감염되지 않았음 |
임신되지 않았음 |
양성(+) |
감염되었음 |
임신되었음 |
이러한 시약검사 역시 오류가 존재하는데, 오류의 유형은 1종 오류와 2종 오류로 구분합니다.
그리고 1종 오류는 위양성 오류, 2종 오류는 위음성 오류라고 부르기도 합니다.
시약검사오류는 검토/감사오류와 마찬가지로 2종 오류를 낮추는 것이 중요합니다.
1종 오류는 재검사를 통해 시정될 수 있지만, 2종 오류는 적절한 처방을 내릴 수 있는 시기를 놓치게 만들 수 있기 때문입니다.
오류 |
검토/감사 |
시약검사 |
1종 오류 |
비효율적 감사 |
비효율적 검사 (추가검사 등을 통해 시정) |
2종 오류 |
비효과적 감사 |
비효과적 검사 (적절한 처방 시점을 놓침) |
침입탐지(Intrusion detection)
외부인이 건물내부로 무단침입하거나 해커가 컴퓨터망을 공격할 경우 이를 시기 적절하게 식별하여 보고하는 실무를 침입탐지라고 하며, 그러한 목적으로 고안된 시스템을 IDS(침입탐지시스템)라고 합니다.
IDS는 침입이 없으면 음성보고(negative report), 즉 잠잠해야 합니다.
하지만 침입이 발생하면 보안담당자에게 문자나 이메일을 통해 양성보고(positive report)를 해야 합니다.
반응/보고 |
시약검사 |
침입탐지 |
음성(-) |
감염/임신되지 않았음 |
침입이 없음 |
양성(+) |
감염/임신되었음 |
침입이 있음 |
침입탐지 실무에서도 1종 오류와 2종 오류가 존재합니다.
한편 침입탐지오류는 시약검사오류와 마찬가지로 위양성 오류와 위음성 오류로 구분하기도 합니다.
오류 |
시약검사 |
침입탐지 |
1종 오류 |
위양성 오류 (이상소견이 없는데 있다고 함) |
위양성 오류 (오탐오류, 잘못된 탐지 오류) |
2종 오류 |
위음성 오류 (이상소견이 있는데 없다고 함) |
위음성 오류 (미탐오류, 탐지하지 못한 오류) |
사용자인증(User authentication)
사용자가 시스템이나 시설에 접근할 때 신분을 검증하는 행위를 사용자인증이라고 합니다.
사용자인증은 패스워드를 입력하거나, 액세스 카드를 제출하거나, 지문이나 홍채를 검사하여 본인인지를 검증하는 등의 방법으로 이루어집니다.
이때 적법한 사용자라면 접근요청을 승인(acceptance)해야 하고, 그렇지 않다면 접근요청을 기각(rejection)해야 합니다.
한편 사용자인증에서도 1종 오류와 2종 오류가 발생할 수 있습니다.
각각의 오류를 정리하면 다음과 같습니다.
오류 |
설명 |
1종 오류 |
FR(False Rejection) 오류 - 적법한 사용자의 접근을 기각하는 오류 FR 비율이 높으면 사용자 편이성이 낮아지므로 서비스업체나 소매업체에서 중요시 함 |
2종 오류 |
FA(False Acceptance) 오류 - 부적법한 사용자의 접근을 승인하는 오류 FA 비율이 높으면 보안이 위태로워지므로 군사조직 등에서 중요시 함 |
1종 오류와 2종 오류의 개념은 다양한 분야에서 품질관리 목적으로 널리 사용됩니다.
물론 해당분야의 업무성격에 따라 1종 오류를 더 강조하기도 하고 2종 오류를 더 심각하게 여기기도 합니다.
또한, 분야마다 각각의 오류유형에 독특한 표현법을 적용하기도 합니다.
하지만 공통점은 일관성 있게 1종 오류는 기각의 오류, 2종 오류는 채택의 오류로 구분한다는 점입니다.
CPA는 다양한 분야의 실무자들을 접해야 하며 1종 오류와 2종 오류의 개념은 광범위하게 사용되기 때문에 한번쯤은 시간을 내어 잘 정리해 두시면 실무에 도움이 되실 것이라고 생각합니다.
출처
https://m.blog.naver.com/uscpalicense/220507326197
'Statistical Learning' 카테고리의 다른 글
큰 수의 법칙 (Law of Large Numbers (LoLN)), 중심극한의 정리 (Central Limit Theorem) (0) | 2020.11.17 |
---|---|
Outliers & leverage (0) | 2020.11.06 |
다중 회귀 분석 vs 다항 회귀 분석 (Multiple VS Polynomial regression analysis) (0) | 2020.11.04 |
[계량 경제학] 도구변수(Instrumental variable) (Feat. 2SLS) (1) | 2020.09.08 |
Ridge VS Lasso regression, Visualized! (0) | 2020.08.14 |