Информация для студентов 2022 года набора
“Мы окружены данными”. Эти слова мы слышим сейчас очень часто, но не всегда относим их к своей деятельности.
На майноре вы познакомитесь с методами и инструментами, которые позволят решить прикладные задачи аналитики во многих областях -- от клиентской и UX-аналитики до цифровых социальных и гуманитарных наук. Найти закономерности в данных и извлечь полезную информацию из текстов, не читая их целиком, оценить нужный показатель и предсказать его значение в будущем, описать собранную статистику или результаты исследования, автоматизировать рутинные операции и не повторять одно и то же много раз, эффективно визуализировать результаты и рассказать о своих выводах так, чтобы убедить остальных -- всему этому мы научимся на майноре.
Так что же такое Data Science и анализ данных -- модные слова или необходимый навык? Это нужно только “технарям” или “гуманитарии” тоже найдут применение этим навыкам? Без глубокой математической подготовки даже не стоит пытаться или разобраться все же можно? Мы за вторые варианты ответов на эти вопросы.
Ограничения для выбора образовательным программам: все программы направления "Прикладная математика и информатика" (Прикладной анализ данных и искусственный интеллект (НИУ ВШЭ - Санкт-Петербург); Прикладная математика и информатика (НИУ ВШЭ - Санкт-Петербург); Прикладная математика и информатика (Москва); Прикладная математика и информатика (НИУ ВШЭ - Нижний Новгород); Компьютерные науки и анализ данных (Москва); Прикладной анализ данных (Москва)), а также Инфокоммуникационные технологии и системы связи (Москва); Информатика и вычислительная техника (Москва); Цифровые платформы и логистика (НИУ ВШЭ - Санкт-Петербург); Маркетинг и рыночная аналитика (Москва); Прикладная математика (Москва); Программная инженерия (Москва); Программная инженерия (НИУ ВШЭ - Нижний Новгород); Программная инженерия (НИУ ВШЭ - Пермь); Разработка информационных систем для бизнеса (НИУ ВШЭ - Пермь); Экономика и анализ данных (Москва); Вычислительные социальные науки (Москва)
Максимальное число слушателей: 90
Целевая аудитория: студенты 2022 года набора
Дисциплины майнора:
- Исследование данных и визуализация (2 курс 1 семестр);
Первый курс майнора посвящен развитию базовых навыков работы с инструментальными средствами анализа данных. Студенты познакомятся с языком R -- универсальным инструментом анализа и визуализации данных и машинного обучения, обладающим большим и дружелюбным сообществом. Мы научимся обрабатывать данные разных типов (чисел, категорий, строк, дат), делать полезные визуализации результатов и эффективные воспроизводимые отчёты и интерактивные презентации. Познакомимся с основными темами последующих курсов: этапами и инструментами исследования данных, применением статистических моделей к предсказанию данных. В результате курса студенты будут способны быстро и эффективно провести исследование данных, графически исследовать ключевые закономерности и представить их в виде интерактивного отчета или дэшборда, построить базовые предсказательные модели.
- Технологии анализа данных (2 курс 2 семестр);
Углубляя навыки из первого курса майнора, в “Технологиях анализа данных” мы познакомимся с ключевыми пакетами, ориентированными на обработку сетей, текстов и других специфичных данных. Студенты научатся находить закономерности в данных, представленных в виде связей между элементами (социальные сети, коммуникации, торговые и политические отношения и т.д.), а также извлекать полезную информацию из длинных текстов, не читая их целиком. Кроме того, мы рассмотрим принципы построения рекомендательных систем и закрепим полученные за год навыки в проекте.
- Предиктивные модели и прикладная аналитика (3 курс 1 семестр)
В этом курсе студенты закрепят полученные ранее навыки и тесно познакомятся с ядром прикладной аналитики данных -- моделями машинного обучения, а также технологиями, необходимыми для решения прикладных задач. Курс разделен на два трека, выбираемые в зависимости от предпочтений, сформированных в течение первого года. Первый трек сфокусирован на задачах прикладной предиктивной аналитики (клиентской, UX, социальной и др.), а также основах баз данных и языка SQL. Второй трек ориентирован на более глубокое знакомство с методами продвинутого анализа сетей и текстов, которые применяются в цифровых социальных и гуманитарных науках. При этом в обоих треках студенты познакомятся с ключевыми понятиями и алгоритмами машинного обучения, получат опыт построения собственных моделей для решения конкретных задач в своей области.
- Приложения и практика анализа данных (3 курс 2 семестр)
Курс посвящен более глубокому погружению студентов в специализированную область анализа данных и выполнение итогового практического проекта с использованием всех компетенций, приобретённых в процессе освоения майнора. Учитывая междисциплинарную важность майнора, в рамках базовой структуры и требований курса могут быть реализованы проекты из различных направлений и предметных областей, причем эти проекты могут быть как исследовательскими, так и прикладными. В рамках курса студентам будут предложены групповые и индивидуальные проекты, а также возможность предложить собственный проект. Кроме того, в первой части курса рассматриваются общие принципы построения продуктов, основанных на данных, изучаются инструменты для создания веб-приложений на R и особенности создания пользовательских интерфейсов