Информация для студентов 2023 года набора

Максимальное количество студентов: 270

Ограничения по программе: запрещено для ПМИ (Москва, Нижний Новгород, Санкт-Петербург), Экономика и анализ данных, Вычислительные социальные науки, Компьютерные науки и анализ данных, Прикладной анализ данных и искусственный интеллект (НИУ ВШЭ - Санкт-Петербург), Цифровые платформы и логистика (НИУ ВШЭ - Санкт-Петербург), Прикладной анализ данных (Москва)

Несколько десятков лет назад компьютеры резко подешевели и стали доступны для широкой аудитории, что произвело революцию как во многих отраслях науки, бизнеса и промышленности, так и в нашей повседневной жизни. С помощью компьютеров можно работать с огромными базами данных, автоматизировать бизнес-процессы, контролировать работу конвейера на производстве, упрощать управление самолетом или просто хранить большую коллекцию семейных фотографий. Примерно 10 лет назад похожая революция произошла с данными. Многие отрасли и компании накопили большие объемы данных, и появилась возможность извлекать пользу из этих данных, находить в них нетривиальные закономерности. Методы машинного обучения позволяют автоматически строить сложные алгоритмы по данным, находить нетривиальные закономерности. Они используются при оптимизации производственных процессов, для планирования закупок и маркетинговых кампаний в интернет-коммерции, для создания новых лекарств и беспилотных автомобилей. На методах машинного обучения базируются все крупные поисковики, "умные ленты" в социальных сетях, рекомендательные системы (в том же YouTube), — и этот список приложений становится больше с каждым годом. Сегодня на наших глазах происходит ещё одна революция. Оказалось, что если радикально увеличить размер модели и обучить её на огромных объёмах данных, то наблюдается существенный рост качества, обнаруживаются новые свойства. Например, большие языковые модели, обученные, по сути, на всех текстах из интернета, неожиданно хорошо могут писать код, делать качественные выжимки из текстов, решать математические задачи, писать эссе и т.д. Каждый месяц растёт качество алгоритмов, генерирующих реалистичные картинки и видео. В этой области много нерешённых задач, но прогресс впечатляет. Специалист по анализу данных, или Data Scientist — одна из самых востребованных и привлекательных профессий нашего времени. Такие люди нужны практически везде, спрос на них огромен и только растет с каждым годом. Становится понятно, что недостаточно наличия специалистов по анализу данных — базовые навыки важны для профессионалов из многих областей бизнеса и науки. Машинное обучение находит свое применение в социальных науках, экономике, физике, журналистике, лингвистике и даже в исторических науках. Понимание методов и возможностей машинного обучения важно для менеджеров и управленцев, которым, вполне возможно, придется столкнуться с необходимостью внедрения или разработки систем анализа данных. Наш майнор покрывает ключевые разделы наук о данных, необходимые для успешного его применения на практике. Первый курс посвящён языку Python, который фактически является стандартом для работы с данными и построения моделей. Во втором курсе (Основы машинного обучения) вы изучите постановки задач, типы данных и способы работы с ними, классические модели машинного обучения (метрические, линейные, решающие деревья, композиции), методы их обучения и подходы к измерению качества. В третьем курсе (Основы глубинного обучения) вы познакомитесь с нейронными сетями и их применениями для задач анализа визуальных и текстовых данных. В четвёртом курсе (Прикладные задачи анализа данных) вы погрузитесь в современные приложения машинного обучения: рекомендательные системы, прогнозирование временных рядов, задачи обработки естественного языка, большие языковые модели, генеративные модели, работа с сигналами.


Майнор ИАД — один из самых трудозатратных в Вышке. На каждом курсе достаточно объёмные домашние задания выдаются раз в 2-3 недели (примеры заданий можно посмотреть на вики-страничках по ссылкам ниже), а на выполнение одного ДЗ может уйти до 10-15 часов. Мы не просто учим решать задачи по заданному алгоритму — мы стараемся дать интуицию о методах машинного обучения, научить быстро осваивать новые инструменты, поделиться опытом практического использования и хотя бы немного показать последние достижения в этой науке. И, конечно, мы готовы приложить максимум усилий, чтобы доступно и интересно донести до вас весь материал курсов. Мы придерживаемся тех же принципов, что и в бакалавриате ПМИ: чтобы получить отличную оценку, надо серьёзно поработать, а 10 баллов — это уже не оценка, а статус. Обучение на ИАДе потребует существенных усилий от вас, но это окупится. Многие студенты, прошедшие через наш майнор, с легкостью проходят собеседования и начинают карьеру в области Data Science. Как говорится, будет сложно, вам понравится. Проходной перцентиль на ИАД в прошлые годы был высоким — так, в 2020 году к нам попали студенты с перцентилем 8% или выше. Информация для желающих перевестись на майнор: 
https://www.notion.so/e69b875daa404bb4af18ae18e7d649e4

Дисциплины:

  1. Введение в программирование
  2. Основы машинного обучения
  3. Основы глубинного обучения
  4. Прикладные задачи анализа данных

 

Вики-странички курсов 23/24 года:

  1. Введение в программирование
  2. Основы машинного обучения
  3. Основы глубинного обучения
  4. Прикладные задачи анализа данных
к предложенным добавить ограничения прошлого года
Прикладной анализ данных и искусственный интеллект (НИУ ВШЭ - Санкт-Петербург); Цифровые платформы и логистика (НИУ ВШЭ - Санкт-Петербург); Прикладной анализ данных (Москва); Экономика и анализ данных (Москва); Экономика и анализ данных (Москва);