Arcadia AI — магистратура
Программа  /  Семестр 2 — Modern AI Stack
Курс

MLOps: data pipelines, feature stores, мониторинг, A/B

Производственный ML: пайплайны данных, воспроизводимость, деплой и мониторинг

Преподаватель уточняется

О курсе

Курс формирует инженерную культуру работы с ML-системами в production. Студенты изучают полный цикл от сырых данных до живого сервиса: ETL, feature stores, model registry, CI/CD для ML, A/B-тестирование и мониторинг дрейфа данных. Курс тесно связан с Практикой 2 и даёт инструментарий, необходимый для командного industrial проекта в семестре 3.

Чему научитесь

Строить воспроизводимый ML-пайплайн от сырых данных до задеплоенной модели
Настраивать feature store с гарантией training/serving parity
Реализовывать CI/CD для ML-проекта с автоматической валидацией данных и моделей
Проводить A/B-тест для ML-компонента с корректным статистическим дизайном
Настраивать мониторинг дрейфа и автоматические алерты деградации модели

Ключевые темы

Data pipelines: Airflow, dbt, batch vs streaming (Kafka, Flink)
Feature stores: offline/online разделение, time-travel, backfilling
Эксперимент-трекинг: MLflow, W&B; model registry и версионирование
Training/serving parity и distribution shift
Контейнеризация и оркестрация: Docker, Kubernetes для ML
CI/CD для ML: тестирование моделей, валидация схем данных, shadow deployment
A/B-тестирование и canary releases
Мониторинг дрейфа данных и деградации качества в production
Cost optimization: spot instances, inference caching, batching
Описание сгенерировано автоматически и ещё не проверено преподавателем — это черновик для обсуждения.