План курса “Анализ данных NGS” для информатиков

Преподаватель: Андрей Пржибельский

  1. Введение. Краткая история секвенирования от Сангера до наших дней. Ключевые характеристики различных технологий секвенирования. Области применения секвенирования и актуальные задачи в биоинформатике.
  2. Выравнивание коротких ридов. Программы Bowtie2 и BWA. Суффиксный массив, преобразование Борроуза-Виллера, FM-индекс и их применение в задачи выравнивания коротких ридов.
  3. Выравнивание длинных ридов с высоким уровнем ошибки. Программы BLASR, hybridSPAdes, MHAP и minmap. Быстрый поиск k-меров, минимальные хеши и минимайзеры.
  4. Исправление ошибок в ридах Illumina. Программы Quake и BayesHammer. Исправление ридов с равномерным и неравномерным покрытием.
  5. Сборка геномов. Подход Overlap-Layout-Consensus. Использование графа де Брюйна для сборки коротких ридов. Упрощение графа де Брюйна. Разрешение геномных повторов.
  6. Оценка качества геномных сборок. Утилита QUAST. Основные метрики оценки качества. Альтернативные методы.
  7. Метагеномика. Основные задачи и проблемы в сборке метагеномов. Биннинг и классификация результатов.
  8. Транскриптомика. Сборка транскриптомов de novo и по референсному геному. Алгоритмы выравнивания ридов РНК. Задача оценки дифференциальной экспрессии генов.