일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- grad-cam
- GCP
- subdag
- chatGPT
- BigQuery
- 공분산
- API Gateway
- airflow subdag
- gather_nd
- XAI
- 상관관계
- flask
- Retry
- login crawling
- spark udf
- correlation
- 유튜브 API
- hadoop
- API
- youtube data
- tensorflow text
- Airflow
- UDF
- session 유지
- requests
- Counterfactual Explanations
- TensorFlow
- integrated gradient
- top_k
- GenericGBQException
- Today
- Total
데이터과학 삼학년
자료포락분석(DEA), 토빗 회귀모형(절단회귀 모형 Tobit) 본문
자료포락분석(DEA)
Data Envelopment Analysis(DEA)는 투입요소와 산출 요소를 투입하여, 투입량 대비 산출량의 효율성을 나타내는 분석을 말한다.
예를 들어 개인, 부서, 조직간의 업무 겅솨를 상대적으로 평가도 가능하며, 운영기관의 경우, 투입한 요소 대비 운영효율이 얼마나 좋은지 상대적으로 평가 가능하다.
자료포락분석(DEA)는 의사결정 단위의 상대적 성과를 측정 평가하므로, 다양한 투입요소 대비 다양한 산출요소를 상대적으로 평가 가능하다.
여기서 말하는 상대적 효율정은 최적의 프론티어(생산 가능곡선) 을 도출한 후 평가 대상들이 프론티어를 기준으로 떨어져있는 정도를 측정하여 비교한다.
자료포락분석(DEA)을 사용할때 가장 중요한 요소가 효율성을 제대로 정의하는 것이다.
여기서 효율성이란
효율성 = 산출물의 가중평균 합 / 투입물의 가중평균 합 을 의미한다.
즉, 투입요소와 산출요소의 정의에 따라 효율성은 달라지게 된다.
자료포락분석은 생산함수와 비용함수를 토대로 설명변수를 설정할 수 있는데
자료포락분석의 모형은 대표적으로 아래와 같다.
규모수익불변 CCR 모형
규모수익가변 BCC 모형
규모효율성 SE
토빗 회귀분석(Tobit)
토빗 회귀분석은 다른 말로 절단회귀 분석으로 제한된 범위의 값을 가지는 data를 회귀모형으로 분석할 때 쓰인다.
예를 들어 추정하고자 하는 종속변수가 무조건 0 이상인(특정 범위가 제한) 값을 갖는다면, 기존의 회귀모형은 이를 반영할 수가 없다.
이때, 활용하는 것이 절단회귀모형(토빗회귀모형)이다. 토빗 회귀모형은 제한된 범위의 종속변수를 추정하는데 매우 적합한 방법이다.
특히 DEA를 통해 추정된 효율성 값은 제한된 범위를 갖기 때문에 효율성에 영향을 미치는 요인 분석에 Tobit 회귀모형을 많이 사용한다.
회귀모형(독립변수 : 투입요소, 종속변수 : 효율성)을 통해 추정된 coefficient 를 통해 효율성에 영향을 미치는 요인의 정도를 파악할 수 있다.
'Statistical Learning' 카테고리의 다른 글
[ISLR] Moving Beyond Linearity (0) | 2020.03.19 |
---|---|
[ISLR] Linear Model Selection and Regularization (0) | 2020.03.11 |
[ISLR] Resampling Methods (1) | 2020.03.03 |
[ISLR] Classification (0) | 2020.02.18 |
KL Divergence(쿨백 라이블러 발산), Jensen-Shannon divergence (0) | 2020.02.13 |