본문 바로가기

Machine Learning

AI 개발의 스포트라이트 ‘MLOps’

 

MLOps. 처음 듣는 사람에겐 털 많은 외눈박이 괴물의 이름 같이 들릴 수 있는데요. 사실은 엔터프라이즈 AI 성공의 키워드입니다.

머신러닝 오퍼레이션(machine learning operations)의 줄임말인 MLOps는 기업이 AI를 성공적으로 활용한 다양한 모범사례를 말합니다.

AI 기술이 상용화된지 얼마 되지 않았기 때문에  MLOps는 비교적 새로운 분야입니다.

엔터프라이즈 AI의 성장 동력, MLOps

한 연구자가 2012년 열린 이미지 인식 대회에서 딥 러닝 기술로 우승을 차지한 일이 있었습니다. AI계의 빅뱅이라 할 수 있는 사건이었는데요. 그 파급효과는 엄청났습니다.

현재 AI는 웹페이지 번역에서 고객 서비스 전화 자동 연결, 병원의 엑스레이 사진 분석 지원, 은행의 신용 리스크 계산, 매출 최적화를 위한 재고 비축에 이르는 다양한 분야에서 널리 사용되고 있습니다.

요약하면 광범위한 AI 산업의 한 분야인 머신러닝이 소프트웨어 애플리케이션 만큼이나 주류 산업으로 곧 부상하게 될 것이라는 뜻입니다. 그래서 머신러닝 실행 프로세스가 IT 시스템을 실행하는 것만큼이나 평범한 일이 돼야 합니다.

DevOps에서 시작된 머신러닝

MLOps는 엔터프라이즈 애플리케이션을 효율적으로 개발, 배포, 실행하는 프로세스나 기술인 DevOps를 기반으로 한 기술인데요. 10년 전 갈등관계에 있던 소프트웨어 개발자(Devs)와 IT 운영 팀(Ops)의 협업 방안으로 고안된 것이 DevOps의 시작이었죠.

MLOps는 데이터세트를 준비하고 이를 분석하는 AI 모델을 만드는 데이터 사이언티스트 팀을 지원합니다. 이 팀에는 데이터세트를 모델을 통해 체계적으로 자동 처리하는 머신러닝 엔지니어도 포함됩니다.

 

 

출처 : blogs.nvidia.co.kr/2020/09/11/what-is-mlops/

 

AI 개발의 스포트라이트 ‘MLOps’ A to Z 알아보기 1 | NVIDIA Blog

MLOps. 처음 듣는 사람에겐 털 많은 외눈박이 괴물의 이름 같이 들릴 수 있는데요. 사실은 엔터프라이즈 AI 성공의 키워드입니다.

blogs.nvidia.co.kr

 

 

서버-클라이언트의 관계를 갖는 서비스들은, 서버는 지속성을 주요한 요소로 생각한다. 즉, 업데이트가 되더라도 유저(클라이언트) 입장에서는 지속적으로 서비스가 사용이 가능해야한다.

 

이러한 것을 CI/CD 라고 부른다. CI/CD는 지속적 통합(Continuous Integration), 지속적 배포(Continuous Deployment)를 말하며, 이러한 것은 개발자(Developer)뿐만 아니라 운영자(Operator), QA(Quality Assuarance)와도 연관이 있다. 개발자는 코드 관련된 수정을 할 것이고, 운영자는 최신의 모델로 업데이트 해야하며, QA는 그것에 대해서 평가를 해야한다.

 

이러한 과정을 잘 묶고, 자동화하려는 기술/시스템을 DevOps 라고 부른다. 그런데 DevOps는 매우 일반화되어있다. 요즘 매우 핫한 ML(Machine Learning)을 이용한 서비스에서는 CI/CD 뿐만 아니라 지속적 학습(CT)이 보장되어야 한다. 예를 들어서, 학습 데이터가 추가 된다던가, 분류해야 하는 레이블이 늘어나는 등 다양한 학습에 관한 시나리오들이 있다. 이러한 학습은 이전의 DevOps에서는 생각하지 못했던 구조이기 때문에- 이 부분에 대해서 추가한 시스템을 MLOps라고 부른다.

 

출처 : lv99.tistory.com/76

 

DevOps와 MLOps

DevOps와 MLOps 소프트웨어가 과거에는 단순히 특정 기기(컴퓨터)에서 실행 될 수 있으면 끝이었다. 정말 옛날에는 업데이트도 유저가 수동으로 하였었지만, 광고를 달면서 수익 모델도 창출하고...

lv99.tistory.com

 

모델을 예측 서비스로 제공하기 위한 수동 ML 단계

 

 

 CT용 ML 파이프라인 자동화

출처 : cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning?hl=ko

 

MLOps: 머신러닝의 지속적 배포 및 자동화 파이프라인  |  Google Cloud

이 문서에서는 머신러닝(ML) 시스템을 위한 지속적 통합(CI), 지속적 배포(CD), 지속적 학습(CT)을 구현하고 자동화하는 기술을 설명합니다. 데이터 과학 및 ML은 복잡한 실제 문제를 해결하고, 업계

cloud.google.com

 

 

'Machine Learning' 카테고리의 다른 글

Docker 환경 구성 (huggingface) docker build 명령어  (0) 2020.08.26
연관 규칙을 사용한 장바구니 분석  (0) 2019.09.26
군집화 이해  (0) 2019.09.26
Strategy Pattern  (0) 2019.09.26