• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Введение в анализ данных

О курсе

Первые несколько занятий данного курса посвящены знакомству с разделами математики, без которых сложно представить современный анализ данных — методами оптимизации, теорией вероятностей, математической статистикой. Далее изучаются линейные модели и решающие деревья — классы моделей, которые наиболее распространены в современном машинном обучении. Подробно рассматриваются их области применимости, особенности работы с различными типами данных, тонкости обучения и настройки. Также изучаются методы оценивания качества моделей (кросс-валидация) и основные метрики качества. На семинарах и в домашних заданиях мы будем предлагать решать реальные задачи — например, фильтрацию спама, оценивание стоимости жилья или распознавание рукописных цифр. В основном мы будем использовать библиотеку scikit-learn, содержащую много готовых методов машинного обучения — но иногда придется реализовать метод самостоятельно, чтобы лучше разобраться в его работе.

Читается: 3-4 модуль 2 курса
Пререквизиты:  Введение в программирование
Трудоемкость:  5 кредитов
Аудиторная нагрузка: 72 часа, из них 36 часов лекций, 36 часов семинаров
Формы контроля: 3 домашних задания, экзамен. 

Преподаватели

Соколов Евгений Андреевич

Департамент больших данных и информационного поиска: Старший преподаватель

 Другие курсы майнора: