Информация для студентов 2023 года набора
В современном мире данные играют важную роль. Они являются источником информации, которую необходимо уметь быстро извлекать и обрабатывать. Знание инструментов работы с данными, а именно DataScience, DataCulture, BigData является главным требованием к специалисту практически любой специальности. Более того, специалисты по статистическому анализу данных востребованы во всех сферах деятельности, а статистический инструментарий является одним из активно развивающихся направлений прикладной науки.
Именно статистический анализ является тем эффективным инструментом, который позволяет раскрыть закономерности процессов, определить факторы, влияющие на события, сделать прогнозы. Инструменты статистического анализа – это те алгоритмы, которые лежат в основе машинного обучения. Они востребованы в таких сферах деятельности, как IT технологии, экономика, менеджмент, социология, медицина, политология, филология, естественные и технические науки и др. Специалист по анализу данных - это специалист, который умеет интерпретировать данные и извлекать из них пользу. Он хорошо разбирается в источниках данных, умеет находить и исправлять в них проблемы, формулировать и проверять гипотезы, визуализировать и интерпретировать полученные результаты.
По итогам изучения программы вы получите самые актуальные знания в одной из самых востребованных областей 21 века.
Ограничения для выбора образовательным программам: Экономика и анализ данных (Москва); Экономика и статистика (Москва); Прикладная математика и информатика (НИУ ВШЭ - Нижний Новгород); Прикладной анализ данных (Москва); Прикладная математика и информатика (Москва); Вычислительные социальные науки (Москва); Прикладной анализ данных и искусственный интеллект (НИУ ВШЭ - Санкт-Петербург); Прикладная математика и информатика (НИУ ВШЭ - Санкт-Петербург).
Максимальное число слушателей: 150
Целевая аудитория: студенты 2023 года набора
Формат обучения: дисциплины майнора будут проходить полностью в онлайн-формате (на платформе webinar).
Язык обучения: русский.
Результат обучения: микроквалификация "Статистик".
Итоговый контроль. В конце четвертой дисциплины (в течение 10 дней до сессии) проводится итоговая защита проектов в виде презентациис комиссионным принятием решения о присвоении микроквалификации "Статистик". Студенты представляют отчет о проделанной работе в письменном виде для проверки (загружают в SmartLMS) и защищают проект перед комиссией (онлайн формат и асинхронная проверка).
Подготовка и защита проекта содержит несколько этапов:
- формулировка цели и задач исследования,
- поиск и подготовка оригинальных данных,
- новизна постановки задач,
- выбор адекватных статистических методов решения задач,
- обоснование практической значимости проекта (описание результатов, которые могут быть применены на практике),
- подготовка практически значимых выводов и интерпретаций,
- защита проектов.
Майнор реализуется совместно с Нижним Новгородом.
Курсы майнора:
1. Первичная обработка и представление статистических данных
В профессиональной деятельности и повседневной жизни мы сталкиваемся с большим потоком разнообразных данных: курсами валют, прибылями и убытками при проведении различных операций, доходами и затратами, рейтингами и результатами управленческой деятельности и т.д. Предлагаемый курс, опираясь на дескриптивные и вероятностно-статистические методы анализа, научит справляться с большим потоком данных, выделять из него главные и наиболее существенные аспекты, максимально наглядно представлять результаты анализа в виде обобщающих показателей, таблиц и графиков, которые предназначены для информационной поддержки принятия рациональных управленческих решений. Вы познакомитесь со скрапингом, инструментами визуализации, позволяющими строить не только графики, но и трехмерные структуры, графы и элементы анимации. Изучение методов сбора и обработки количественных и качественных данных, включая полученные в ходе выборочных исследований, будет опираться на большое количество практических примеров из различных сфер деятельности, использование универсальных информационных технологий и возможности средств статистического анализа в MS EXCEL, R, Python
2. Классификация статистических данных
Окружающие нас объекты и явления (например, финансовая деятельность банков или предприятий, доходы респондентов, уровень жизни в странах мира или в отдельно выбранной стране, решение о покупке товаров и т.п.) характеризуются разнообразными признаками и могут быть представлены как точки в многомерном пространстве. В этом пространстве они могут образовывать скопления (группы, кластеры), которые можно изучать в отдельности, выделив специфические свойства и особенности каждой группы. В курсе Вы изучите различные подходы и методы к кластеризации и классификации данных с использованием, как традиционного инструментария, так и современных методов Data Culture, Machine Learning, основы фильтрации изображений. Важной особенностью курса является широкое использование наглядных примеров и применение широкого арсенала современных средств обработки статистической информации (ППП SPSS, среды R, Python), освобождающих исследователя от вычислительной рутины и позволяющих превратить статистическое исследование в увлекательное занятие.
3. Моделирование статистических зависимостей
Дисциплина нацелена на освоение методов исследования зависимостей и их приложений главным образом в экономике и социальной сфере. В то же время она расширяет возможности развития профессиональных компетенций, которые формируются на основных образовательных программах обучаемых, путем освоения современной статистической методологии и возможностей ее использования в различных областях знаний.
4. Временные ряды и их практическое применение
Представленные в хронологической последовательности данные об объектах, или временные ряды, являются информационной базой для статистического прогнозирования. Методы прогнозной экстраполяции основаны на использовании свойства инерционности процессов и моделирования основной тенденции (тренда) и циклических изменений. Современные социально-экономические процессы все более утрачивают инерционность в силу "виртуализации" основных показателей, например, финансовых, и преобладающими моделями временных рядов становятся бестрендовые. Какую модель предпочесть и как рассчитать ее параметры, чтобы сделать прогноз на будущее? Какой прогноз: краткосрочный или долгосрочный, - можно сделать на основе построенной модели, и насколько он надежен? Ответы на эти и другие вопросы можно найти в процессе изучения предлагаемого курса, в ходе которого будут отработаны модели прогнозирования на основе реальных данных. Для моделирования и прогнозирования предполагается широкое использование передовых информационных технологий и прикладных программ.