1 of 34

PDB, Jmol, PyMolи работа с трехмерными�структурами

2 of 34

План

  • Основные методы расшифровки пространственных структур макромолекул
  • База данных и сайт PDB �(зеркала PDBe –Европа, PDBj – Япония)
  • Визуализаторы структур
  • Язык Jmol (JSmol)

2

3 of 34

PDB файл

3

  • Может иметь расширение *.ent, *.pdb
  • PDB ID – цифра + 3 символа (в этом примере 1BAW)
  • Подразделяется на цепочки (A, B, …, 1, 2...), которые состоят из остатков (Glu1, Thr2, etc)
  • Внутри (в строчках ATOM) написаны координаты атомов белка, возможно, ДНК, РНК; а также (в строчках HETATM) лигандов, ионов, молекул воды …

HEADER ELECTRON TRANSFER 19-APR-98 1BAW

TITLE PLASTOCYANIN FROM PHORMIDIUM LAMINOSUM

ATOM 1 N GLU A 1 35.039 18.146 24.600 1.00 73.96 N

ATOM 2 CA GLU A 1 34.182 18.513 25.759 1.00 73.96 C

ATOM 3 C GLU A 1 33.126 19.536 25.368 1.00 73.96 C

ATOM 4 O GLU A 1 33.124 20.038 24.244 1.00 87.91 O

ATOM 5 CB GLU A 1 35.048 19.052 26.891 1.00 87.91 C

ATOM 6 CG GLU A 1 36.075 18.056 27.376 1.00 87.91 C

ATOM 7 CD GLU A 1 37.009 18.647 28.405 1.00 87.91 C

ATOM 8 OE1 GLU A 1 36.536 19.012 29.502 1.00 87.91 O

ATOM 9 OE2 GLU A 1 38.220 18.744 28.120 1.00 87.91 O

ATOM 10 N THR A 2 32.242 19.858 26.307 1.00 27.58 N

ATOM 11 CA THR A 2 31.164 20.807 26.063 1.00 27.58 C

ATOM 12 C THR A 2 30.988 21.697 27.283 1.00 27.58 C

ATOM 13 O THR A 2 30.583 21.234 28.347 1.00 31.52 O

ATOM 14 CB THR A 2 29.834 20.077 25.761 1.00 31.52 C

ATOM 15 OG1 THR A 2 29.997 19.235 24.612 1.00 31.52 O

ATOM 16 CG2 THR A 2 28.726 21.078 25.487 1.00 31.52 C

ATOM 17 N PHE A 3 31.345 22.968 27.128 1.00 27.51 N

ATOM 18 CA PHE A 3 31.235 23.948 28.204 1.00 27.51 C

ATOM 19 C PHE A 3 29.925 24.713 28.083 1.00 27.51 C

4 of 34

Источники данных

4

  1. Рентгеноструктурный анализ (РСА, X-ray).
    1. Дает структуру белка в кристалле.
    2. Обычно не содержит атомов водорода
    3. Главный показатель качества – разрешение (Resolution), прописывается в заголовке файла. Разрешение меньше 1 Å – очень хорошее, даже водороды есть. Разрешение меньше 2 Å – хорошее, больше 3 Å – плохое (1Å = 0,1нм = 10–10м).
    4. B-фактор (температурный фактор) – последнее число в строчке, где описан атом. Показатель надежности координат конкретного атома и его подвижности. Чем меньше – тем точнее. Меньше 25 – очень хорошо, больше 50 – не слишком надежно.
    5. Метод решения фазовой проблемы … это такая есть проблема в рентгеновском эксперименте, которую каждый раз надо решать. Если написано Molecular replacement, – значит были использованы координаты атомов другой структуры, которые могли отразиться на результате.

5 of 34

5

  1. Ядерный магнитный резонанс (NMR)
    1. Дает структуру белка в растворе.
    2. Молекула в растворе не «жёсткая». Поэтому файл с ЯМР-расшифровкой состоит из многих моделей (MODEL), которые более или менее показывают разные конформации.
  2. CryoElectron microscopy
    • Получается в результате усреднения множества наложенных друг на друга изображений. Это позволяет установить приблизительную форму отдельных частей белка.
    • Там тоже есть разрешение (Resolution), но оно имеет несколько иной смысл. В разных частях разрешение разное. Разрешение меньше 3Å можно считать очень хорошим. Разрешение хуже 10Å годится для больших комплексов.
    • Позволяет получать структуру больших макромолекулярных комплексов (рибосомы, капсиды вирусов, …)
  3. Иные методы, например, моделирование (в т.ч AlphaFold).

6 of 34

Сайт Protein Data Bank https://www.rcsb.org/

6

Advanced – хороший поиск …

7 of 34

Advanced search

7

.. не только по ключевым словам, но и по наличию лигандов,

методу решения структуры и многому другому

Смотрим на сайте PDB!

8 of 34

Страница одной структуры

8

9 of 34

Structural viewers

9

  1. Jmol
    • Требует установки
    • Установка Jmol требует установки Java
    • Используется как в виде отдельной программы, так и в виде плагина (Java applet) на некоторых сайтах.�Впрочем, плагины нынче не поддерживаются :(
  2. JSmol�Работает во всех браузерах, не использует Java, по интерфейсу максимально приближен к Jmol.

10 of 34

Structural viewers

10

    • PyMol
      1. Еще больше возможностей
      2. Требует установки
      3. Предварительно надо будет установить Python
      4. Даёт изображения более высокого качества (после применения команды ray). Рекомендуется для подготовки изображений к печати
      5. Вообще рекомендуется его изучить тем, кто работает с 3D структурами

Им вообще все эти программы надо изучить :)

Про установку PyMol под Windows читайте https://pymolwiki.org/index.php/Windows_Install

11 of 34

PyMol (красивый и умелый)

11

12 of 34

PyMol (красивый и умелый)

12

13 of 34

Jmol/JSmol

13

Далее описан язык, которым надо пользоваться для подготовки изображений в Jmol/JSmol.

14 of 34

Язык �Jmol�(введение)

14

Мы видим картинку,

а Jmol знает про

множества атомов

15 of 34

Язык �Jmol�(load)

15

Формат команды

load <имя файла>

load =<PDB-код>

Назначение

Загрузить новый файл или скачать запись из PDB

Примечания

  1. Jmol не понимает русских букв в консоли
  2. При открытии больших файлов может долго думать
  3. После открытия удобно написать команду�restrict none

16 of 34

Язык �Jmol�

16

Все остальные команды

могут сделать что-то,�но никто, кроме вас, не может знать,�с какой частью молекулы это делать

поэтому используйте команды

restrict и select

17 of 34

Язык �Jmol�(select)

17

Формат команды

select <выражение>

Назначение

Назначить новое выделение

Примечания

  1. Предыдущее выделение пропадает
  2. Выражения могут быть очень сложными,�но сначала мы рассмотрим простые примеры
  3. После выполнения команды в консоли отображается�количество выделенных атомов

18 of 34

Язык �Jmol�(простые выражения)

18

  1. Любое выражение описывает набор атомов
  2. Заранее определены некоторые�интуитивно понятные выражения, �а именно:
  1. Можно вводить также
  2. трехбуквенные обозначения аминокислот (ala, ser, …)
  3. названия полипептидных цепей, например :a или :1
  4. порядковые номера, например 72, 1-125:a
  5. слова all, none, selected
  6. названия химических элементов: carbon, oxygen, …

at

acidic

acyclic

aliphatic

alpha

amino

aromatic

backbone

basic

bonded

buried

cg

charged

cyclic

cystine

helix

hetero

hydrophobic

ions

large

ligand

medium

neutral

nucleic

polar

protein

purine

pyrimidine

selected

sheet

sidechain

small

solvent

surface

turn

water

19 of 34

Язык �Jmol�(restrict)

19

Формат команды

restrict <выражение>

Назначение

Назначить новое выделение и спрятать изображение всего остального

Примечания

  1. Старое выделение и предыдущее изображение пропадают
  2. Более того – можно долго раскрашивать структуру и �неосторожно потерять все, применив restrict, поэтому
  3. Лучше сначала попробовать команду select, �а потом еще и подумать

20 of 34

Язык �Jmol�(что мы видим)

20

Формат команды

<cпособ> [off|<число>|only]

Назначение

Нарисовать выбранным способом

Примеры способов изображения

  1. cartoons – нарисует ленточки
  2. cpk – нарисует шарики
  3. backbone 0.5 – нарисует остов толщины 0,5 ангстрем
  4. сpk off – сотрёт шарики
  5. cartoons only – нарисует ленточки и сотрёт остальное

21 of 34

21

wireframe

backbone

trace

cpk

spacefill

cartoons

strands

Язык �Jmol�(способы изображения)

22 of 34

Язык �Jmol�(color)

22

Формат команды

color <цвет>

Назначение

Покрасить выделенное в нужный цвет

Что такое <цвет>

  1. Цветом может быть red, green, white и т.д.
  2. Можно указать на специальную цветовую схему,�например�cpk, structure, chain, monochrome, group

23 of 34

23

Примечания

  • Можно писать и color, и colour
  • сolor не добавляет изображение, �а только красит, причём как видимое, �так и невидимое

Немного об RGB цветах

  • RGB – это способ описания цветов, при котором�каждый цвет представляется, как комбинация �красного, зеленого и синего
  • Можно писать цвета в виде �color [R,G,B] (три числа от 0 до 255)
  • Например, [255,255,255] – это белый,� [100,100,0] – смесь красного с зеленым, а� [0,0,0] – черный.

Язык �Jmol�(color)

24 of 34

Язык �Jmol�(center)

24

Формат команды

center <выражение>

Назначение

Центрирует изображение по заданному множеству атомов

Можно, например, писать�center selected

или�center :a

25 of 34

Язык �Jmol�(zoom)

25

Формат команды

zoom <размер>

Назначение

Изменяет размер

Примечание: изменяется размер всего изображения, �а не только выделенного фрагмента

26 of 34

Язык �Jmol�(script)

26

Формат команды

script <имя файла>

Назначение

Выполнить команды, записанные в файле.

Примечания

  1. Jmol умеет сохранять скрипты, восстанавливающие�текущее изображение. Что написано в таком скрипте – �не понять
  2. Все ошибки, которые встретились в скрипте,�при выполнении скрипта отмечаются в консоли
  3. Строки скрипта, начинающиеся с символа #, игнорируются

27 of 34

Язык �Jmol�(пример)

27

load C:\PDB\1ncx.pdb — загрузить файл

restrict none — удалить всё изображение

select all — выделить всё (мы указываем программе, что далее будем работать со всеми атомами из файла)�1433 atoms selected — ответ программы (но изображения пока нет!)

cartoons — изобразить в виде ленточной модели

color group — раскрасить по номеру остатка

28 of 34

Язык �Jmol�(атомы)

28

Atom expressions

ser25:a.ca – Cα атом серина 25 цепочки A�25:a – все атомы остатка номер 25 цепочки A�25 – все атомы из остатков номер 25 всех цепочек �:a – все атомы цепочки A�ser – все атомы всех серинов

Можно использовать знаки * и ?

ser25.c? – все углероды 25-х серинов �ser*:a.ca – Cα атомы всех серинов цепочки :a

29 of 34

Язык �Jmol�(and,or,not)

29

Любые части выражений

можно комбинировать с помощью

логических операций и скобок

Все азоты, не входящие в состав белка

nitrogen and not protein

Все кислороды, входящие в состав белка �или нуклеиновых кислот

(protein or nucleic) and oxygen

:a and :c� ничего выделено не будет

Аденины в цепочках A и С

(:a or :c) and a

30 of 34

Язык �Jmol�(within)

30

Формат выражения

within(<расстояние>,выражение)

Назначение

В командах select, restrict и define определяет атомы, расположенные на расстоянии не более заданного от атомов выражения.

Примечание: расстояния надо указывать, используя точку (не «5», а «5.0»)

31 of 34

31

Примеры

Выделить атомы, расположенные

на расстоянии не более 3Å от DNA

select within(3.0,dna)

на расстоянии не более 2,5Å от DNA

select within(2.5,dna) and not dna

на расстоянии не более 3Å от белка (только атомы DNA)

select within(3.0,protein) and dna

остатки, имеющие хотя бы один атом

на расстоянии не более 2,5Å от DNA

define nears within(2.5,dna) and not dna

select within(group, nears)

Язык �Jmol�(within)

32 of 34

32

Формат команды

define <имя> <выражение>

Назначение

Назвать группу атомов своим именем

Зачем это надо?

Часто бывает необходимо построить очень

сложное выражение. Обычно его можно написать в одну

строчку, но неудобно. Кроме того, если потребуется его

использовать еще раз – то define позволяет просто

сослаться на ранее определенное имя

Язык �Jmol�(define)

33 of 34

Язык �Jmol�(пример)

33

load c:\PDB\1apl.pdb

restrict none

define needdna dna and within(18.0,:c)

define need needdna or :c

select need

center selected

select :c and backbone

wireframe 80

select needdna

wireframe

select needdna and C and not backbone

wireframe 80

wireframe

define cw :c and within(3.0,needdna)

select cw

select cw and not backbone

cpk 150

cpk off

define mainc :c and (136,175,182,184-186)

select mainc

wireframe 120

select needdna and within(5.0,mainc)

wireframe 120

Этот пример надо набить в�Jmolе и объяснить

34 of 34

  • http://jmol.sourceforge.net/
  • http://wiki.jmol.org/index.php/Main_Page
  • https://kodomo.fbb.msu.ru/wiki/Main/Jmol

�И про PyMol

  • https://kodomo.fbb.msu.ru/wiki/Main/PyMol
    • в частности, тут есть инструкция по установке
  • https://www.pymol.org/
  • http://www.pymolwiki.org/index.php/Category:Commands

34