일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- spark udf
- airflow subdag
- TensorFlow
- GenericGBQException
- correlation
- session 유지
- top_k
- youtube data
- subdag
- GCP
- Counterfactual Explanations
- API
- gather_nd
- requests
- tensorflow text
- API Gateway
- chatGPT
- 유튜브 API
- login crawling
- Airflow
- UDF
- Retry
- BigQuery
- XAI
- 상관관계
- grad-cam
- integrated gradient
- 공분산
- flask
- hadoop
- Today
- Total
데이터과학 삼학년
ML Ops and Kubeflow Pipelines 본문
ML Ops and Kubeflow Pipelines
- 운영의 어려움을 조금 덜어보자(개발&운영)
- devops : 시스템의 자동화, 모니터링
> 개발자의 반복작업 줄이고, 효율성 향상
- ML ops ? : machine learning 시스템을 자동화하고, 모니터링하는 것(학습~예측~결과출력)
> 역할을 나누고, 확장성을 증가 시킴
> example : candy sorter demo
- google은 엔지니어와 ml리서처를 한 팀으로 구성하여 프로젝트 진행(프로젝트를 위해서)
-
data scientist가 주피터 노트북으로 모델을 잘 학습시켜 모델을 만듦
-
만들어진 모델을 ops 엔지니어에게 전달
-
ops 엔지니어가 구글 클라우드에서 온라인예측이 가능하도록 구성시킴
- 한 feature가 변하면 모든 feature에 영향을 줄 수 있음
> 하이퍼파라미터의 변화는 전체 결과에 영향을 줄 수 있음
> release는 비교적 운영에 비해 쉬운 편
- 사람이 이해할 수 있는 모델을 먼저 만들고 그 후 앙상블 모델을 만들어 보는 단계로 넘어감
> 딥러닝 모델은 해석하기 어려운 문제가 있기때문에
- 하나의 복잡하고 큰 모델을 만드는 것보다는 여러 모델을 앙상블로 이용하여 적용하는 것이 좋음
- TFX(TensorFlow eXtended)는 tensorflow를 이용해 ml end-to-end 시스템화하는 도구
> TFDV → 시각화 툴
: 학습데이터와 eval 데이터의 분포차이를 함께 볼 수 있음 → 데이터셋의 문제를 확인할 수 있음
> TFMA → 모델의 성능(행동)을 볼 수 있음(텐서보드 같은 것인데 보다 다양하게 볼수 있음) : 트랙가능
- ML Fairness : 데이터의 카테고리를 나눠주고, 많은 Data 중….일반적이지 않은 특이성?을 찾아줌(예. 신발을 그려라인데 구두 그린 것)
- ML lifecycle의 중요성 → ml의 pipeline을 제대로 가지고 있는 것 필요
> kubeflow pipeline 을 만들었음 → 쿠버네티스를 이용한 확장 버전
- container를 나눠서 data scientist가 작업을 한 것을 엔지니어가 환경에 맞게 구성한 container에 담아서 서비스하는 형식
- 주피터 → 서비스 환경 이동 → 스케일러블하게 확장
-TFE(TensorFlow Enterprise)
> 구글에는 AI 관련 연구조직(구글 팀), 상업적 조직(구글 클라우드팀) 나눠져 있음
> TFE는 구글 클라우드 팀에서 만듦
- Deep Learning Containers : 베타 서비스로 제공
'Machine Learning' 카테고리의 다른 글
Tensoflow train_and_evlauate 구성도 (0) | 2020.02.03 |
---|---|
Operationalizing the Model (0) | 2020.02.03 |
Explore and Creating the Dataset (0) | 2020.02.03 |
Preprocessing and feature creations (with Cloud Dataprep) (0) | 2020.02.03 |
Apache Beam / Cloud Dataflow (0) | 2020.01.18 |