데이터과학 삼학년

ML Ops and Kubeflow Pipelines 본문

Machine Learning

ML Ops and Kubeflow Pipelines

Dan-k 2020. 2. 3. 16:16
반응형

ML Ops and Kubeflow Pipelines

- 운영의 어려움을 조금 덜어보자(개발&운영)

- devops : 시스템의 자동화, 모니터링

  > 개발자의 반복작업 줄이고, 효율성 향상

- ML ops ? : machine learning 시스템을 자동화하고, 모니터링하는 것(학습~예측~결과출력)

  > 역할을 나누고, 확장성을 증가 시킴

  > example : candy sorter demo

- google은 엔지니어와 ml리서처를 한 팀으로 구성하여 프로젝트 진행(프로젝트를 위해서)

  1. data scientist가 주피터 노트북으로 모델을 잘 학습시켜 모델을 만듦

  2. 만들어진 모델을 ops 엔지니어에게 전달

  3. ops 엔지니어가 구글 클라우드에서 온라인예측이 가능하도록 구성시킴

- 한 feature가 변하면 모든 feature에 영향을 줄 수 있음

  > 하이퍼파라미터의 변화는 전체 결과에 영향을 줄 수 있음

  > release는 비교적 운영에 비해 쉬운 편

- 사람이 이해할 수 있는 모델을 먼저 만들고 그 후 앙상블 모델을 만들어 보는 단계로 넘어감

  > 딥러닝 모델은 해석하기 어려운 문제가 있기때문에

- 하나의 복잡하고 큰 모델을 만드는 것보다는 여러 모델을 앙상블로 이용하여 적용하는 것이 좋음

- TFX(TensorFlow eXtended)는 tensorflow를 이용해 ml  end-to-end 시스템화하는 도구

  > TFDV → 시각화 툴

    : 학습데이터와 eval 데이터의 분포차이를 함께 볼 수 있음 → 데이터셋의 문제를 확인할 수 있음

  > TFMA  → 모델의 성능(행동)을 볼 수 있음(텐서보드 같은 것인데 보다 다양하게 볼수 있음) : 트랙가능

- ML Fairness : 데이터의 카테고리를 나눠주고, 많은 Data 중….일반적이지 않은 특이성?을 찾아줌(예. 신발을 그려라인데 구두 그린 것)

-  ML lifecycle의 중요성 → ml의 pipeline을 제대로 가지고 있는 것 필요

  > kubeflow pipeline 을 만들었음 → 쿠버네티스를 이용한 확장 버전

- container를 나눠서 data scientist가 작업을 한 것을 엔지니어가 환경에 맞게 구성한 container에 담아서 서비스하는 형식

- 주피터 → 서비스 환경 이동 → 스케일러블하게 확장

-TFE(TensorFlow Enterprise)

  > 구글에는 AI 관련 연구조직(구글 팀), 상업적 조직(구글 클라우드팀) 나눠져 있음

  > TFE는 구글 클라우드 팀에서 만듦

- Deep Learning Containers : 베타 서비스로 제공

 

728x90
반응형
LIST
Comments