План курса “Анализ данных NGS”
Преподаватель: Андрей Пржибельский
- Введение. Краткая история секвенирования от Сангера до наших дней. Ключевые характеристики различных технологий секвенирования. Области применения секвенирования и актуальные задачи в биоинформатике.
- Выравнивание коротких ридов. Программы Bowtie2 и BWA. Суффиксный массив, преобразование Борроуза-Виллера, FM-индекс и их применение в задачи выравнивания коротких ридов.
- Выравнивание длинных ридов с высоким уровнем ошибки. Программы BLASR, hybridSPAdes, MHAP и minmap. Быстрый поиск k-меров, минимальные хеши и минимайзеры.
- Исправление ошибок в ридах Illumina. Программы Quake и BayesHammer. Исправление ридов с равномерным и неравномерным покрытием.
- Сборка геномов. Подход Overlap-Layout-Consensus. Использование графа де Брюйна для сборки коротких ридов. Упрощение графа де Брюйна. Разрешение геномных повторов.
- Оценка качества геномных сборок. Утилита QUAST. Основные метрики оценки качества. Альтернативные методы.
- Транскриптомика. Сборка транскриптомов de novo и по референсному геному. Алгоритмы выравнивания ридов РНК. Задача оценки дифференциальной экспрессии генов.
- Метагеномика. Основные задачи и проблемы в сборке метагеномов. Биннинг и классификация результатов.
Аттестация:
- Сдать все лабы на 100%
- Написать два теста на хорошую оценку
- Сдать теор. зачет (каждая сданная позже срока добавляет один вопрос на зачете)