Command-line tools for bioinformatics

Преподаватель: Геннадий Захаров, EPAM Systems

  1. Описание курса

Общая цель курса – научиться комфортно работать в командной строке Linux/MacOsX и научиться эффективно обрабатывать данные при помощи инструментов командной строки.

Мы познакомимся с ключевыми понятиями, необходимыми для работы в командной строке, наиболее полезными командами, их опциями и примерами использования. Примеры направлены в первую очередь на анализ данных биоинформатики – секвенированных последовательностей ДНК, генов и т. д. Помимо стандартных команд Linux (zcat, grep, sed, awk) рассмотрим утилиты для работы с последовательностями (bwa, samtools, bedtools). В заключении курса кратко рассмотрим установку программ из исходного кода.

Практика будет полезна всем, кто ожидает столкнуться с анализом больших объемов текстовых или табличных данных.

  1. Learning outcomes

По окончанию практики участники смогут использовать командную строку для  анализа данных в тех случаях где это эффективнее, чем при помощи визуальных утилит или написания собственных программ. Также участники смогут комфортно работать в системах, где единственным доступным интерфейсом является командная строка (например компьютерные кластеры и другие окружения для высокопроизводительных расчетов).

  1. Требования к ПО

Для выполнения заданий в рамках практики потребуется любой дистрибутив Linux (установленный в виртуальной машине или “на железе) или MacOsX. Ожидается, что все описанные команды без изменений будут работать в окружении MacOsX, однако 100% применимость всех команд не  проверялась.

  1. Аттестация

Итоговая оценка будет складываться из результатов тестов после каждой практики. Тесты будут выполнены либо в виде текстовых заданий, либо в виде набора задач на платформе Stepic (https://stepik.org/).

  1. Дополнительные материалы и полезные ссылки

  1. https://habr.com/ru/post/47163/
  2. https://linuxconfig.org/bash-scripting-tutorial-for-beginners
  3. https://ryanstutorials.net/bash-scripting-tutorial/ 
  4. https://habr.com/ru/post/126996/ 
  5. https://www.biostars.org/p/335903/