• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Введение в анализ данных

Читается

Пререквизиты: «Введение в программирование»

Трудоемкость:  кредитов

72 аудиторных часа:

  • 36 часов лекции;
  • 36 часов семинары

Формы контроля:

  • 1 экзамен,
  • 3 домашних задания

О курсе

В начале этого курса мы познакомим вас с разделами математики, без которых сложно представить современный анализ данных — методы оптимизации, теория вероятностей, статистическое оценивание. После этого мы займемся изучением линейных моделей и решающих деревьев, двух наиболее распространенных видов моделей в анализе данных. Мы уделим много внимания тому, как правильно применять данные методы к различным видам данных, как измерять и оценивать их качество. На семинарах и в домашних заданиях мы будем решать реальные задачи — например, фильтрация спама, оценивание стоимости жилья или распознавание рукописных цифр. В основном мы будем использовать библиотеку scikit-learn, содержащую много готовых методов машинного обучения — но иногда придется реализовать метод самостоятельно, чтобы лучше разобраться в нем.

Программа

Ведущий лектор

Соколов Евгений Андреевич

Департамент больших данных и информационного поиска: заместитель руководителя