Машинное обучение на практике
Пока неизвестно
24 ак.ч.
онлайн
удостоверение о повышении квалификации государственного образца
41 900 ₽
Подробнее о курсе
Документ после выпуска
удостоверение о повышении квалификации государственного образца
Программа курса
1. Обзор задачи (теория – 1 час)
Какие задачи хорошо решаются машинным обучением, а какие им пытаются решать. Что произойдёт, если вместо Data Scientist взять неспециалиста в данной области (просто разработчика/аналитика/менеджера) с ожиданием, что в процессе научится.
2. Подготовка, очистка, исследование данных (теория – 1 ч, практика – 1 ч)
Как разобраться в исходных бизнес-данных (и вообще обнаружить в них какой бы то ни было порядок). Последовательность обработки. Что можно и нужно переложить на аналитиков предметной области, а что лучше сделать самому Data Scientist. Приоритеты решения конкретной задачи.
3. Классификаторы и Регрессоры (теория – 2 ч, практика – 2 ч)
Практический раздел - хорошо формализованные задачи с подготовленными данными. Разница между задачами (бинарная/небинарная/вероятностная классификация, регрессии), перераспределение задач между классами. Примеры классификации практических задач.
4. Кластеризация (теория – 1 ч, практика – 2 ч)
Где и как проводить кластеризацию: исследование данных, проверка постановки задачи, проверки результатов. Какие случаи можно свести к кластеризации.
5. Оценка моделей (теория – 1 ч, практика – 1 ч)
Бизнес-метрики и технические метрики. Метрики для задач классификации и регрессии, матрица ошибок. Внутренние и внешние метрики качества кластеризации. Кросс-валидация. Оценка переобучения.
6. Оптимизация (теория – 5 ч, практика – 3 ч)
Что делает одну модель лучше другой: параметры, признаки, ансамбли. Управление параметрами. Практика выбора признаков. Обзор инструментария для поиска лучших параметров, признаков и методов.
7. Графики, отчеты, работа с живыми задачами (теория – 2 ч, практика – 2 ч)
Как доступно объяснить происходящее: себе, команде, клиенту. Более красивые ответы на бессмысленные вопросы. Как презентовать три терабайта результатов на одном слайде. Полуавтоматические тесты, какие точки контроля процесса действительно нужны. От живых задач к полному R&D процессу («НИОКР на практике») – разбор и анализ задач от аудитории.
Оставьте отзыв
Похожие курсы
Оставьте заявку
Наши консультанты ответят на все вопросы
И помогут в выборе
Нажимая кнопку, вы даете согласие на обработку персональных данных