Languages

Большие данные: инфраструктуры и методы решения задач




Программное обеспечение вычислительных сетей

Магистерская программа "Большие данные: инфраструктуры и методы решения задач"

Научный руководитель: профессор, д.ф.-м.н. Л.А. Калиниченко

Цель магистерской программы "Большие данные: инфраструктуры и методы решения задач" - подготовка магистров, специализирующихся в области проектирования и применения масштабируемых инфраструктур оперирования разно-структурированными большими данными, создания и использования методов решения задач анализа больших данных в таких инфраструктурах (в мире подобная специализация именуется «наукой о данных» ("data science")). Программа основана на новейших технологиях, воплощенных в современных платформах Big Data, и предусматривает освоение методов и инструментов создания масштабируемых программ анализа больших разно-структурированных данных в распределенных кластерах, виртуальной и материализованной интеграции данных при создании посредников и хранилищ больших данных, выделения, сопоставления и слияния сущностей в массивных коллекциях неструктурированных и слабоструктурированных данных, а также применения в таких процессах методов статистического анализа и машинного обучения. Особое место в программе занимает освоение методов формулирования и решения задач в областях с интенсивным использованием данных, направленных на ускорение исследований и базирующихся на вышеперечисленных методах и инструментах оперирования большими данными. В результате студенты должны овладеть методами решения задач обнаружения аномалий в коллекциях больших данных, моделирования разнообразных явлений при проведении экспериментов, стимулированных гипотезами, извлечения информации из разнообразных коллекций больших данных в социальных средах. В программе предусмотрено развитие навыков совместной работы в процессе анализа данных и решения задач в таких областях как астрофизика, социология, экономика.

Учебный план

Дисциплина 1
семестр
2
семестр
3
семестр
4
семестр
ч/н   ч/н   ч/н   ч/н  
Иностранный язык 4 зач 4 экз        
Правоведение     4 экз        
Русский язык, деловое общение 2 экз            
Суперкомпьютерное моделирование и технологии         4 экз    
История и методология прикладной математики         2 зач    
Современная философия и методология науки 2 экз            
Межфакультетские курсы по выбору 2 зач 2 зач        
Управление разно-структурированными большими данными  4  экз            
Прикладной многомерный статистический анализ 2 экз             
Виртуальная интеграция неоднородных данных и унификация моделей данных  2  экз            
Идентификация и слияние сущностей в больших данных      4  экз        
Материализованная интеграция данных и организация хранилищ больших данных      4  экз        
Интеллектуальный анализ данных          4  экз    
Анализ больших данных в социальных средах          3  экз    
Детектирование аномалий в больших данных              4  экз
Администрирование суперкомпьютерных систем              4  экз
Гипотезы и модели в областях с интенсивным использованием данных              4 экз
Дисциплина по выбору из списка     2 экз  2  экз  2  зач
Спецсеминар "Параллельные вычисления" 2 зач  2  зач  2  зач  2  зач
Научно-исследовательская работа               оценка
Курсовая работа       оценка        
часов 20   22   17   10  
зачетов   3   2   3   2
экзаменов   5   5   4   4
Защита магистерской диссертации               оценка
Государственный экзамен по направлению               оценка

Список дисциплин по выбору студента для магистерской программы "Суперкомпьютерные системы и приложения":
 Графы и их применения
 Анализ временных рядов
 Облачные вычисления и виртуализация информационных ресурсов
 Математические методы анализа текста (на англ. яз.)
 Методы поиска достоверных эмпирических закономерностей в многомерных данных
 Неклассические математические модели обработки данных
 Пакеты прикладных программ для статистической обработки и анализа данных
 Модели представления знаний и онтологии
 Извлечение информации из изображений