Множинне вирівнювання послідовностей (MSA) - це вирівнювання трьох або більше біологічних послідовностей, як правило, білка, ДНК або РНК. У багатьох випадках передбачається, що вхідний набір послідовностей запитів має еволюційні відносини, з яких вони мають спільний зв'язок і походять від загального предка. З отриманого MSA можна зробити висновок про гомологію послідовностей та провести філогенетичний аналіз для оцінки загального еволюційного походження послідовностей. Візуальні зображення вирівнювання, ілюструють події мутацій, такі як точкові мутації (зміни однієї амінокислоти або нуклеотиду), які відображаються як різні символи в одному стовпці вирівнювання, і мутації вставки або видалення (вставки або пробіли), які відображаються як дефіси в одній або кількох послідовно при вирівнюванні. Множинне вирівнювання послідовностей часто використовуються для оцінки послідовності збереження з білкових доменів, третинних та вторинних структур, а також окремих амінокислот або нуклеотидів.
Множинне вирівнювання послідовностей
… це те саме, що парне, тільки послідовностей скільки завгодно
Навіщо будують множинні вирівнювання?
дозволяє знайти спільне
мотиви, патерни, профілі
пошук активного центру
передбачення3D-структури
дозволяє оцінити еволюційні відносини
Реконструкція еволюції
Побудова множинних вирівнювань – необхідний етап вирішення багатьох завдань молекулярної біології.
Червоним виділено консервативні (однакові в усіх) залишки; жовтим – на 80% консервативні (однакові майже у всіх) залишки
Червоним виділено консервативні та функціонально консервативні залишки.
Множинне вирівнювання послідовностей використовує більше інформації, ніж парне, тому (теоретично) має в середньому частіше виходити біологічно осмисленим.
Біологічна задача - поставити один під одним гомологічні позиції
Математична задача знайти спосіб кількісного порівняння якості вирівнювань.
Програмування - створення ефективного алгоритму та його реалізація
Методи прогресивного вирівнювання
Методи побудови множинного вирівнювання шляхом послідовного поєднання попарних вирівнювань
• Як правило, спочатку будується наближене дерево філогенезу
• За допомогою дерева вибирається порядок побудови попарних вирівнювань
• Далі послідовності додаються по черзі до головного вирівнювання, або вирівнювання (профілі) вирівнюються один з одним
Множинне вирівнювання послідовностей
Що корисного?
Алгоритми:
-Динамічне програмування
Прогресивне вирівнювання. Clustal
Clustal (1988) виконує поступове вирівнювання нових послідовностей, починаючи з найбільш <еволюційно> близьких, орієнтуючись на попередньо побудоване на підставі парних вирівнювань філогенетичне дерево.
Алгоритм:
Ітеративне вирівнювання. MUSCLE
Три стадії: