Мини-проекты по биоинформатике

Преподаватель: Михаил Райко, mike.rayko@gmail.com

Время: по чётным субботам, 15:00

Курс состоит из нескольких практических заданий, которые выполняются в смешанных группах. Задания будут основаны на реальных событиях данных, и посвящены различным аспектам биоинформатики (в основном анализ данных NGS).

Чему будем учиться?


а) Использовать различные биоинформатические инструменты для решения конкретных биологических задач

б) Выбирать подходящие тулы под задачи, задавать осмысленные вопросы и тестировать гипотезы.

в) Писать связные осмысленные тексты о том, что вы делаете и зачем(!).

Как будем учиться?

Каждую неделю вам будет выдаваться описание проекта - краткое введение, исходные данные и инструкция по выполнению. Сначала инструкции будут более подробные, по мере продвижения к концу курса будет всё больше свободы.

Важно - все проекты подразумевают запуск тулов, поэтому вам потребуется доступ к компьютерам с Linux. Данные будут не очень большие, мощности среднего ноутбука должно хватить.

Как будем оценивать?

По каждому проекту надо написать отчёт и прислать мне. Отчёт представляет собой мини-статью, на 1-2 страницы, с введением, методами, результатами и т.п. Подробные инструкции и критерии оценки здесь. Дедлайн - 18:00 пятницы накануне следующего занятия (т.е. на каждое задание у вас будет две недели).


За каждый отчёт можно получить максимум 10 баллов. Можно добрать 2 дополнительных балла за “лабораторный журнал” - см.
инструкцию. Один проект с минимальным числом баллов будет отброшен. Ещё 1 дополнительный балл, если отчёт написан на английском.

Для зачёта нужно получить к концу семестра не менее 70% от максимального количества баллов.

Правила хорошего тона

Вы можете обсуждать проект с коллегами, вместе искать ответы и подсказки в интернете, обращаться за помощью и т.п. Но ваш текст - это ваш продукт, и он должен быть написан самостоятельно и отражать ваше понимание.
Можно и даже поощряется использовать опубликованные статьи, но вы должны
ссылаться на них в своем отчёте. Не копируйте код и текст, написанный вашими коллегами. Не постите вопросы на ресурсах типа SeqAnswers или StackOverflow (можно искать ответы в уже существующих темах, просто не создавайте новые темы с вопросами по вашим проектам).

Дословное цитирование чужих текстов или их фрагментов без указания авторства - это плагиат. Не надо так.

Предварительное расписание (может и, вероятно, будет меняться)

22.09. “What causes antibiotic resistance?” Alignment to reference, variant calling.

6.10.  “I got vaccinated; why did I get the flu?!” Deep sequencing, error control, p-value, viral evolution

20.10. “E.coli outbreak investigation”. De novo bacterial genome assembly, annotation.

03.11. "Tardigrades: from genestealers to space marines". Eukaryotic genome annotation and analysis.

17.11. “H+”. 23andMe, SNPs, GWAS

01.12. "1D vs 3D". Proteins, structure-based phylogeny.

15.12. “Differential expression in bread”. RNA-seq analysis.