Темы исследований для студентов ИПМ 2016

Интеллектуальный анализ медицинских баз данных на основе семантических технологий

Образование

Проектирование и разработка программных систем  и инструментария на основе управляемого кода

Система бизнес-моделирования на основе семантических технологий

Semantic Data Warehouse

Семантический Интернет вещей

Разработка методов обработки и визуального представления статистических данных для проведения анализа в системе поддержки принятия решений

Автоматическая обработка естественного языка в системе семантического поиска

Веб-сервис визуализации и, в последующем, создания и изменения семантических датасетов и онтологий

Агрегирование и анализ данных в системе электронного обучения Open edX с использованием семантических технологий

Разработка демонстрационного прототипа экспертной системы, предоставляющей рекомендации по публикации научных статей в журналах выбранной предметной области

Разработка системы оценки качества наборов открытых данных по формальным критериям, изложенным в Методических рекомендациях по публикации открытых данных

Разработка и моделирование новых типов сенсоров для систем дистанционного зондирования Земли

Разработка пользовательского интерфейса для системы облачного моделирования sdCloud

Разработка системы обработки и визуального представления открытых транспортных данных реального времени

Интеллектуальный анализ и разработка медицинских баз данных на основе семантических технологий

Семантический анализ и обработка медицинских данных

Инструментальные средства агрегации, анализа и отображения медицинских данных на примере результатов электрокардиографических исследований

Разработка интеллектуальной системы планирования

Разработка нейросетевых моделей для широкого круга задач обработки и анализа данных: в экономике и бизнесе, авионике, робототехнике, медицине, автоматизации производства, связи, интернете, безопасности и охранных системах и др.


Интеллектуальный анализ медицинских баз данных на основе семантических технологий

Исследование базы медицинских данных, собранных специалистами более, чем за десять лет.  Знания, извлеченные из данных, должны позволить интеллектуализировать сложные процессы ведения и сопровождения пациентов в медицинских учреждениях. Результатом работы должен стать прототип реальной системы обработки и анализа медицинских данных. Критерием оценки результатов будут отзывы врачей, эксплуатирующих систему.

Руководитель и контакты: Наталия Александровна Жукова, nazhukova@mail.ru 

Темы работ и задачи:

Технологии:

Языки программирования и моделирования:

Требования:

Интерес к исследовательской работе, разработке алгоритмов, базовые знания в области статистики и технологий обработки и анализа данных, наличие навыков проектирования и разработки ПО, знание английского, знание Java.

Образование

Руководитель и контакты: Наталия Александровна Жукова, nazhukova@mail.ru 

Темы работ и задачи:

Проектирование и разработка программных систем  и инструментария на основе управляемого кода

Создание и исследование средств языково-ориентированной разработки, применения предметно-специфичных языков и их взаимоинтеграции. Проверка корректности программ, эмуляция сетевой и аппаратной инфраструктуры для тестирования приложений и управления удаленным доступом. Создание гетерогенных распределенных бесшовно взаимодействующих сред для развертки приложений, выполняющих различные прикладные и аналитические задачи.

Руководитель и контакты:

Кореньков Юрий Дмитриевич, ged.yuko@gmail.com

Логинов Иван Павлович, ivan.p.loginov@gmail.com / vk.com/i.p.loginov

Темы работ и задачи:

Технологии:

Требования:

             Интерес к прикладной разработке и исследованию способов решения поставленных задач. Навык проектирования структур данных, программных API, реализации алгоритмов. Умение ориентироваться в наборе взаимосвязанных предметных областей. Готовность выполнять задачи в режиме творческого поиска. Английский на уровне чтения статей, документации и поиска технической информации.

Система бизнес-моделирования на основе семантических технологий

Руководитель и контакты: 

Галкин Михаил Александрович, mikhgalkin@gmail.com 

Разработка онтологического архитектурного окружения для моделирования архитектуры предприятия и его бизнес процессов. Разработка основ корпоративного искусственного интеллекта (Enterprise AI). State-based modeling - концепция моделирования, основанная на описании работы моделируемого объекта в каком-либо состоянии, а также на процессах переходов между состояниями.

Темы и задачи:

Технологии

Требования

Хороший технический английский для написания статей в зарубежные реферируемые журналы и конференции, умение программировать, подготовка в статистике и логике, ориентация в мире Semantic Web для быстрого поиска онтологий или уже известных технологий / методов, умение укладываться в дедлайны. Опыт работы с бизнес-моделями приветствуется.

Semantic Data Warehouse

Руководитель и контакты: 

Галкин Михаил Александрович, mikhgalkin@gmail.com 

Разработка масштабируемой СУБД на базе RDF и Hadoop. Применение Extract-Transform-Load (ETL) для представления гетерогенных (мультимодальных) данных форматов XML, CSV в виде RDF-молекул. Целью проекта является интеграция разнородных данных в едином масштабируемом, производительном RDF-хранилище. RDF-молекула - множество троек вида <s, p, o> с одинаковым s.

Темы и задачи:

Требования

Хороший технический английский для написания статей в зарубежные реферируемые журналы и конференции, знание технологий баз данных (индексы, joins, query evaluation), опыт работы с Hadoop, Spark, HBase и организации работы кластеров на их основе. Языки программирования - Java, Python или C/C++. Знание RDF в контексте СУБД приветствуется.

Семантический Интернет вещей

Руководитель и контакты: 

Колчин Максим Александрович, kolchinmax@niuitmo.ru

В рамках данного направления исследуются методы применения технологий семантического веба для решения существующих проблем в обеспечении интероперабельности Интернета вещей. В частности, мы занимаемся разработкой как программных так и аппаратных систем на базе платформ Arduino и Raspberry Pi.

Темы и задачи:

Ниже представлен список направлений работ, на базе которых в индивидуальном порядке будут предложены конкретные задачи для решения в рамках бакалаврской/магистерской диссертации.

Технологии

Требования

Хороший технический английский для чтения и написания статей в зарубежные реферируемые журналы и конференции, умение программировать, умение укладываться в дедлайны. Технологиям Semantic Web научим, кроме того есть отдельный курс “Методы онтологического инжиниринга”.

Разработка методов обработки и визуального представления статистических данных для проведения анализа в системе поддержки принятия решений

Предполагается исследование основных тенденций заболеваний, выявление зависимостей и конструирование прогнозов на основе анонимизированных медицинских данных, а также разработка методов визуального представления медицинских данных, используемых для проведения анализа в системе поддержки принятия решений.

Руководитель и контакты

Радченко Ирина Алексеевна, iradche@gmail.com 

Темы работ и задачи

Технологии

Средства и языки программирования, предназначенные для очистки и визуального представления данных: OpenRefine, Excel, R, Python, Perl, Processing, D3.JS, Leaflet, CartoDB, JavaScript, HTML5 и др.

Предпочтительно использование программного обеспечения с открытым кодом.

Требования

Желание узнавать новое, обучаться новым языкам программирования и технологиям.

Исполнительность и обязательность.

Знание английского на уровне чтения и написания документации.

Умение программировать на языках высокого уровня.

Автоматическая обработка естественного языка в системе семантического поиска

Руководитель и контакты:

Ковригина Любовь Юрьевна, lkovriguina@gmail.com

 

Работа по данному направлению предполагает широкий спектр междисциплинарных исследований, предусматривающий владение по завершении исследований знаниями в области математической лингвистики, (математические модели языка, формальные грамматики), автоматической обработки естественного языка (извлечение фактов, извлечение именованных сущностей), методов интеллектуального анализа данных.

 

Темы и задачи:

Основные направления работы: 1) разработка систем понимания спонтанной речи, 2) разработка систем извлечения фактов и автоматического пополнения онтологий и баз знаний, 3) порождение текста из высказываний на формальном языке, 4) автоматическое извлечение процессов.

По каждому из направлений работы можно работать над 1) методами и алгоритмами, 2) разработкой приложений, 3) разметкой данных и разработкой “золотых стандартов” (и их сочетаниями).

Ниже приведен список направлений работ, на базе которых в индивидуальном порядке будут предложены конкретные задачи для решения в рамках бакалаврской/магистерской диссертации.

 

Веб-сервис визуализации и, в последующем, создания и изменения семантических датасетов и онтологий

Дополнение существующего бесплатного веб-сервиса с открытым кодом, предназначенного для простой и быстрой визуализации семантических данных (Linked open data), а также онтологий с целью превращения его в среду совместной разработки онтологий. С текущей версией сервиса можно ознакомиться по ссылке www.ontodia.org 

Руководитель и контакты:
Павлов Дмитрий Сергеевич, dmitry.pavlov@vismart.biz, https://ru.linkedin.com/in/dspavlov

Темы работ и задачи:

Технологии:

Требования:

Агрегирование и анализ данных в системе электронного обучения Open edX с использованием семантических технологий

Руководители и контакты:

Романов Алексей Андреевич, romanov@corp.ifmo.ru

Волчек Дмитрий Геннадьевич, dvolchek@corp.ifmo.ru

В рамках данного направления исследуются методы применения технологий семантического веба для решения существующих проблем в системах электронного обучения, а именно процессах создания и анализа качества учебных материалов, в т.ч. персонализация и индивидуализация образовательных траекторий, адаптируемость учебных материалов на основе поведенческих паттернов пользователей системы.

Тема и задачи:

        

Технологии:

                

Требования:

Хороший технический английский для написания статей в зарубежные реферируемые журналы и конференции. Желание и умение самостоятельно разбираться в чужом коде (Open edX - открытая платформа с большим сообществом). Желательно компьютер или ноутбук > 6 Gb RAM (для комфортной работы с виртуальной машиной).

Разработка демонстрационного прототипа экспертной системы, предоставляющей рекомендации по публикации научных статей в журналах выбранной предметной области

Предполагается исследование и разработка прототипа экспертной системы, рекомендующий научные журналы для публикации в них статей по выбранным предметным областям.

Руководитель и контакты

Радченко Ирина Алексеевна, iradche@gmail.com 

Тема работ и задачи

 Разработка демонстрационного прототипа экспертной системы, предоставляющей рекомендации по публикации научных статей в журналах выбранной предметной области

  1. Разработка подсистемы логического вывода
  2. Разработка подсистемы автоматической рассылки предупреждающих сообщений о сроках подачи научных статей

Технологии

Средства и языки программирования, предназначенные для разработки экспертных систем: LISP, PROLOG, CLIPS и др.

Предпочтительно использование программного обеспечения с открытым кодом.

Требования

Желание узнавать новое, обучаться новым языкам программирования и технологиям.

Исполнительность и обязательность.

Знание английского на уровне чтения и написания документации.

Умение программировать на языках высокого уровня.

Разработка системы оценки качества наборов открытых данных по формальным критериям, изложенным в Методических рекомендациях по публикации открытых данных

Предполагается исследование оценки качества открытых данных в соответствии с заданными критериями, а также разработка критериев проверки качества открытых данных на основе исследовательских работ по оценке доступности и валидности наборов открытых данных.

Руководитель и контакты

Радченко Ирина Алексеевна, iradche@gmail.com 

Тема работ и задачи

Разработка системы оценки качества наборов открытых данных по формальным критериям, изложенным в Методических рекомендациях по публикации открытых данных

Технологии

Средства и языки программирования, предназначенные для очистки и визуального представления данных: OpenRefine, Excel, R, Python, Perl, Processing, D3.JS, Leaflet, CartoDB, JavaScript, HTML5 и др.

Предпочтительно использование программного обеспечения с открытым кодом.

Требования

Желание узнавать новое, обучаться новым языкам программирования и технологиям.

Исполнительность и обязательность.

Знание английского на уровне чтения и написания документации.

Умение программировать на языках высокого уровня.

Разработка и моделирование новых типов сенсоров для систем дистанционного зондирования Земли

Данная работа включает в себя следующие направления исследований:

  1. Преобразование системы ДЗЗ из физической в информационную. Т.е. разработка модели системы съёмки которая оперировала бы не физическими величинами и параметрами, а информационными. В рамках этой работы, для каждого узла системы ДЗЗ необходимо разработать механизм перехода от физических параметров, описывающих данный узел к информационным. Имея такое преобразование, можно будет построить общую модель системы оперируя только информационными величинами.
  2. Использование методы математического и имитационного моделирования необходимо разработать варианты реализации многоспектрального (цветного) сенсора на базе обычного сенсора ПЗС линейного типа.
  3. Исследовать возможность построения модели системной динамики, описывающей процесс дистанционного зондирования Земли или обоснованно доказать неприменимость такого подхода в моделировании к данной задаче.

Руководитель: Иван Перл, ivan.perl@corp.ifmo.ru

Разработка пользовательского интерфейса для системы облачного моделирования sdCloud

В нашем университете, совместно с ведущими вузами из других стран разрабатывается платформа для облачного расчёта моделей системной динамики.

Одним из ключевых факторов, определяющим успешность этой разработки является удобство использования этого решения, поэтому задаче разработки эффективного и удобного пользовательского интерфейса уделяется большое внимание.

Сложность этой работы, помимо качественного исполнения основных операций, таких, как загрузка моделей, управление ими и планирование их исполнения, заключается в необходимости корректного и понятного отображения результатов моделирования. Так как проект sdCloud позиционируется как система общего назначения для области системной динамики, то необходимо разработать подход, позволяющий приемлемо отобразить результат работы практически любой модели. Поэтому в рамках этой задачи необходимо изучить варианты результатов исполнения различных моделей системной динамики и разработать подход для их разбора и отображения.

Сайт проекта: http://sdcloud.ifmo.ru 

Руководитель: Иван Перл, ivan.perl@corp.ifmo.ru

Разработка системы обработки и визуального представления открытых транспортных данных реального времени

В данном проекте предполагается исследование возможностей обработки и визуального представления открытых транспортных данных г. Санкт-Петербурга, а также открытых данных проекта http://xn--80abhddbmm5bieahtk5n.xn--p1ai/ 

Руководитель и контакты

Радченко Ирина Алексеевна, iradche@gmail.com 

Тема работ и задачи

Разработка системы обработки и визуального представления открытых транспортных данных реального времени.

Технологии

Средства и языки программирования, предназначенные для очистки и визуального представления данных: OpenRefine, Excel, R, Python, Perl, Processing, D3.JS, Leaflet, CartoDB, JavaScript, HTML5 и др.

Предпочтительно использование программного обеспечения с открытым кодом.

Требования

Желание узнавать новое, обучаться новым языкам программирования и технологиям.

Исполнительность и обязательность.

Знание английского на уровне чтения и написания документации.

Умение программировать на языках высокого уровня.

Интеллектуальный анализ и разработка медицинских баз данных на основе семантических технологий

Исследование базы медицинских данных, собранных специалистами за много лет. Результатом работы должен стать веб-ориентированный прототип системы обработки и анализа медицинских данных. Критерием оценки результатов будут отзывы врачей, эксплуатирующих разработанную систему.

Руководитель и контакты:

Илья Владимирович Исаев, ivisaev@corp.ifmo.ru

Темы работ и задачи:

Технологии:

Требования:

Интерес к прикладной и исследовательской работе, разработке алгоритмов, базовые знания в области статистики и технологий обработки и анализа данных, наличие навыков проектирования и разработки ПО. Знание английского для чтения и написание статей в зарубежные реферируемые журналы.

Семантический анализ и обработка медицинских данных

Исследование базы медицинских данных, собранных специалистами за десятилетие. Данные представляют собой записи на естественном языке (субъективные данные) и результаты диагностических исследований (объективные данные). Результатом работы должен стать прототип системы обработки и анализа медицинских данных SMDA. Критерием оценки результатов будут отзывы медицинского персонала, тестирующего и эксплуатирующего разработанную систему.

Руководитель и контакты:

Максим Владимирович Лапаев, m.lapaev@telemetria.ru, max.wproject@gmail.com

Темы работ и задачи:

Технологии:

Требования:

Интерес к прикладной и исследовательской работе, разработке алгоритмов, базовые знания в области статистики и технологий обработки и анализа данных, наличие навыков проектирования и разработки ПО. Знание английского для чтения и написание статей в зарубежные реферируемые журналы. Знание русского на должном уровне для грамотного общения и работой с материалом.

Инструментальные средства агрегации, анализа и отображения медицинских данных на примере результатов электрокардиографических исследований

Руководитель и контакты:

 Лебедев Сергей, lebedev.sv.etu@gmail.com

Темы работ и задачи:

Разработка интеллектуальной системы планирования

С подробным описанием можно ознакомиться в презентации: https://goo.gl/6nki2e

Руководитель и контакты: Калёнова Ольга Вячеславовна, olgakalyonova.ifmo@gmail.com

Темы работ и задачи:

Разработка интеллектуальной системы планирования

Требования:

  1. Желание исследовать область Искусственного Интеллекта в той или иной мере. Наличие текущих знаний приветствуется, но не обязательно.
  2. Желание автоматизировать ручной труд – основное свойство программиста.
  3. Умение самостоятельно искать информацию, читать книги, статьи, уметь пользоваться Интернетом.
  4. Умение писать код, научитесь конечно еще и в процессе, но хотя бы желание научиться писать код и не лениться в этом необходимо.

Разработка нейросетевых моделей для широкого круга задач обработки и анализа данных: в экономике и бизнесе, авионике, робототехнике, медицине, автоматизации производства, связи, интернете, безопасности и охранных системах и др.

Руководитель и контакты: Симоненко Зинаида Григорьевна, ZGSim@ yandex. ru

Темы работ и задачи:

Анализ предметной области, в том числе и. известных работ в данной области. Уточнение задачи и определения цели исследования. Определение требований к используемым алгоритмам и исходным данным. Выбор алгоритмов обработки, анализа и представления (также и с учетом необходимости включение результатов в системы более высокого уровня) данных, и их обоснование.

Разработка методов и алгоритмов классификации и структуризации разнородных данных;

Разработка методов работы с многомерными данными;

Разработка методов визуализации разнородных данных;

Разработка математических и компьютерных моделей с применением численных методов для решения прикладных задач.

Прикладная область: учет и контроль акустических параметров за состоянием пчелиной семьи, учет влияния параметров дистанционного мониторинга морской среды (температура, скорость, давление и т.д.) для целей прогнозирования техногенных катастроф: устойчивости климата, динамических характеристик моря вдоль береговой линии, прокладка маршрута движения для роботов, мониторинг параметров воды с учетом влияния излучения космических объектов.

Технологии:

Требования:

Интерес к прикладной и исследовательской работе, разработке алгоритмов, базовые знания в области математики ( желательно),базовые знания в области технологий обработки и анализа данных и статистики, наличие навыков проектирования и разработки ПО. Знание английского для чтения и написание статей в зарубежные реферируемые журналы (желательно).