MLOps: data pipelines, feature stores, мониторинг, A/B

О курсе

Курс формирует инженерную культуру работы с ML-системами в production. Студенты изучают полный цикл от сырых данных до живого сервиса: ETL, feature stores, model registry, CI/CD для ML, A/B-тестирование и мониторинг дрейфа данных. Курс тесно связан с Практикой 2 и даёт инструментарий, необходимый для командного industrial проекта в семестре 3.

Чему научитесь

✓Строить воспроизводимый ML-пайплайн от сырых данных до задеплоенной модели

✓Настраивать feature store с гарантией training/serving parity

✓Реализовывать CI/CD для ML-проекта с автоматической валидацией данных и моделей

✓Проводить A/B-тест для ML-компонента с корректным статистическим дизайном

✓Настраивать мониторинг дрейфа и автоматические алерты деградации модели

Ключевые темы

•Data pipelines: Airflow, dbt, batch vs streaming (Kafka, Flink)

•Feature stores: offline/online разделение, time-travel, backfilling

•Эксперимент-трекинг: MLflow, W&B; model registry и версионирование

•Training/serving parity и distribution shift

•Контейнеризация и оркестрация: Docker, Kubernetes для ML

•CI/CD для ML: тестирование моделей, валидация схем данных, shadow deployment

•A/B-тестирование и canary releases

•Мониторинг дрейфа данных и деградации качества в production

•Cost optimization: spot instances, inference caching, batching

Описание сгенерировано автоматически и ещё не проверено преподавателем — это черновик для обсуждения.

О курсе

Чему научитесь

Ключевые темы

Обратная связь