Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
Копылов Кирилл Евгеньевич
ФББ МГУ имени М.В. Ломоносова, выпускник аспирантуры
НИВЦ МГУ, младший научный сотрудник
Курс «Нейронные сети и их применение в научных исследованиях»
2-гидроксибифенил-3-монооксигеназа
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
Структура тетрамера 2-гидроксибифенил-3-монооксигеназы
Метадинамика
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
https://www.youtube.com/watch?v=IzEBpQ0c8TA
Метадинамика с нейросетевой CV
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
Bonati L., Rizzi V., Parrinello M. Data-driven collective variables for enhanced sampling // The journal of physical chemistry letters. ACS Publications, 2020. Vol. 11, № 8. P. 2998–3004.
Модели
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
https://avandekleut.github.io/vae/
Датасет
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
Положение петель в разных структурах датасета
Визуализация датасета двугранных углов участков HbpA с помощью UMAP. Раскраска по HDBSCAN
Результаты
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
Отображение датасета с помощью гиперсферического VAE
Отображение датасета с помощью классического VAE
Loss = cosine distance + 1∙10-2 KL divergence
Результаты
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
Изоповерхность потенциальной энергии метадинамики с гиперсферическим VAE на уровнях
-140 (голубой) и -110 кДж/моль (красный).
Серый - оптимальная структура (минимум “А”)
Цветной - предсказание Alphafold
Валидация
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
Biedermannova L. et al. Another role of proline: stabilization interactions in proteins and protein complexes concerning proline and tryptophane //Physical Chemistry Chemical Physics. – 2008. – Т. 10. – №. 42. – С. 6350-6359.
Валидация
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
Белый- оптимальная структура из метадинамики (минимум “А”)
Серый - структура ЯМР из PDB 1L2Y
Отображение датасета Trp-cage с помощью гиперсферического VAE
Исходный код
Исходный код и датасет Trp-cage доступны в репозитории GitLab:
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
Моделирование структуры подвижных участков белка с помощью GPU-ускоренной метадинамики с коллективными переменными на основе вариационных автоэнкодеров
Заключение