250x250
반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- correlation
- GCP
- Counterfactual Explanations
- gather_nd
- Retry
- TensorFlow
- login crawling
- GenericGBQException
- API
- tensorflow text
- XAI
- UDF
- API Gateway
- 상관관계
- BigQuery
- grad-cam
- flask
- spark udf
- session 유지
- integrated gradient
- 공분산
- Airflow
- top_k
- 유튜브 API
- requests
- hadoop
- youtube data
- chatGPT
- subdag
- airflow subdag
Archives
- Today
- Total
목록2025/02 (1)
데이터과학 삼학년

1. SMOTE (Synthetic Minority Over-sampling Technique)개념SMOTE는 소수 클래스(minority class)의 데이터를 합성하여 새로운 데이터를 생성하는 방식의 오버샘플링 기법입니다. 단순히 데이터를 복제하는 것이 아니라, K-최근접 이웃(K-NN) 기반으로 새로운 데이터를 생성하여 데이터의 다양성을 증가시킵니다.알고리즘소수 클래스의 데이터 샘플을 선택합니다.선택된 샘플의 K-최근접 이웃을 찾습니다.이웃 중 하나를 랜덤하게 선택하여 기존 데이터와의 차이를 계산합니다.이 차이에 랜덤한 값을 곱하고 기존 데이터에 더하여 새로운 데이터를 생성합니다.장점기존 데이터를 단순 복제하는 것이 아니라, 새로운 데이터를 생성하여 모델의 일반화 성능을 향상시킴.다양한 데이터 분포..
Statistical Learning
2025. 2. 23. 20:30