250x250
반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- flask
- top_k
- Retry
- correlation
- API
- chatGPT
- grad-cam
- integrated gradient
- tensorflow text
- gather_nd
- 상관관계
- GCP
- spark udf
- 유튜브 API
- hadoop
- session 유지
- TensorFlow
- youtube data
- requests
- subdag
- BigQuery
- API Gateway
- login crawling
- GenericGBQException
- Counterfactual Explanations
- XAI
- airflow subdag
- 공분산
- UDF
- Airflow
Archives
- Today
- Total
목록UDF (1)
데이터과학 삼학년
[Spark] 사용자 정의함수(UDF)
UDF (user defined function) - 사용자 정의 함수는 스파크에서 가장 강력한 기능 중 하나 - 파이썬이나 스칼라 그리고 외부 라이르브러리를 사용해 사용자가 원하는 형태로 트랜스포메이션을 만들 수 있게 함 - UDF는 한개 이상의 컬럼을 입력으로 받고 반환 가능 UDF 는 스파크의 드라이버 프로세스내에 저장되어 운용되며, 각 익스큐터에 전달하여 처리가 됨 pyspark sql 구문에서 udf를 사용하려면 정의한 udf를 sql 구문내 function으로 사용할 명령어를 아래와 같이 꼭 등록해야 사용 가능 >> 파이썬 함수를 SQL 함수로 등록!!! spark.udf.register("word_count", word_count) ### spark udf 생성 from pyspark.sql..
Hadoop
2023. 3. 6. 23:01