-
AI 시스템 구축 – MLOps 완전 정리카테고리 없음 2025. 8. 31. 13:39
목적: MLOps 개념을 DevOps와 비교해 쉽게 설명하고, 구성요소·레벨·장단점·시험 포인트까지 체계적으로 정리.
0) 한눈에 핵심
- MLOps = 머신러닝 + 운영(Ops).
- 모델 개발부터 배포·모니터링·재학습까지 전체 파이프라인 자동화·관리.
- 목표: 재현성, 신뢰성, 지속 운영.
1) DevOps와 비교해 직관적으로
- DevOps: 소프트웨어 코드를 빠르게 빌드-테스트-배포.
- MLOps: 데이터 수집→모델 학습→배포→모니터링→재학습까지 ML 특화 루프 관리.
- 차이점: ML은 데이터/모델이라는 변수가 추가 → 데이터 드리프트, 모델 성능 저하 문제 대응 필요.
2) MLOps 핵심 구성요소
- 데이터 파이프라인: 수집→정제→피처엔지니어링.
- 실험 관리: 버전 관리(데이터·모델·코드), 실험 추적(MLflow, Weights&Biases).
- 모델 학습/튜닝 자동화: HPO, AutoML.
- 배포(Serving): API/배치/스트리밍, 컨테이너(Kubernetes, Docker).
- 모니터링: 성능(정확도, AUC), 데이터 분포, 지연(latency), 비용.
- 재학습 루프: 드리프트 감지→데이터 수집→재학습→배포.
3) MLOps 성숙도 레벨
- Level 0 (Manual): 수동 실행, 재현성↓.
- Level 1 (ML Pipeline Automation): 데이터→학습→배포 파이프라인 자동화.
- Level 2 (CI/CD + 자동화): 코드 변경 시 자동 빌드/배포 + 데이터·모델 자동 테스트.
- Level 3 (선진형): 완전 자동화 + 지속 모니터링/재학습.
4) 장점
- 재현성: 같은 데이터/코드로 언제든 동일 모델 생성.
- 효율성: 자동화로 개발→배포 시간 단축.
- 신뢰성: 지속 모니터링으로 성능저하 빠르게 탐지.
- 협업 용이: 데이터/모델 버전 관리로 팀 협업 강화.
5) 도전 과제
- 초기 세팅 복잡(인프라·도구 다양).
- 데이터/모델 버전 관리 난이도.
- 조직 문화: DevOps→MLOps 전환 시 협업 방식 변화 필요.
6) 시험장 포인트
- MLOps = DevOps + 데이터/모델 루프 관리.
- 주요 단계: 데이터 파이프라인, 학습/튜닝, 배포, 모니터링, 재학습.
- 성숙도 레벨: Manual→Pipeline→CI/CD→선진 자동화.
- 키워드: 재현성, 자동화, 모니터링, 드리프트 대응.
7) 실전 체크리스트
- 데이터/모델/코드 버전 관리 도입했는가?
- 파이프라인 자동화(Airflow/Kubeflow 등) 구현했는가?
- 배포 전략(API/배치/스트리밍) 정의했는가?
- 모니터링 지표/알림 세팅했는가?
- 드리프트 감지→재학습 루프 설계했는가?
8) 미니 연습(정답은 접어서)
- DevOps와 MLOps의 차이를 한 줄로?
- MLOps에서 ‘재현성’을 위해 필요한 관리 대상 3가지는?
- 성숙도 Level 2의 특징은?
정답 보기
1) DevOps는 코드 배포 자동화, MLOps는 **데이터+모델 생애주기 자동화**. 2) 데이터, 코드, 모델(아티팩트). 3) CI/CD 기반으로 코드 변경 시 자동 빌드/배포 + 데이터/모델 자동 테스트.