250x250
반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
Tags
- XAI
- hadoop
- gather_nd
- 유튜브 API
- flask
- 공분산
- Counterfactual Explanations
- API
- session 유지
- grad-cam
- chatGPT
- TensorFlow
- UDF
- GenericGBQException
- BigQuery
- tensorflow text
- spark udf
- youtube data
- Retry
- GCP
- API Gateway
- integrated gradient
- top_k
- requests
- subdag
- Airflow
- login crawling
- airflow subdag
- 상관관계
- correlation
Archives
- Today
- Total
목록2024/03/07 (1)
데이터과학 삼학년
[sklearn in spark] spark분산환경을 이용한 모델 예측
sklearn 모델을 spark 환경에서 분산 인퍼런스하기!!! - pandas udf를 활용 : spark 드라이버가 각 worker에게 모델을 전달하고, 각 worker는 해당 모델을 이용해 pandas udf에서 spark dataframe을 pandas dataframe으로 변환해 예측하고 이를 다시 spark dataframe형태로 리턴 코드예시 from pyspark.sql.functions import col from sklearn.linear_model import LinearRegression # 데이터 생성 data = [("row1", 1.0, 2.0, 3.0), ("row2", 4.0, 5.0, 6.0)] columns = ["id", "feature1", "feature2", "f..
Machine Learning
2024. 3. 7. 12:00