ABCDEFGHIJKLMNOPQRSTUVWXYZ
1
2
Бактерия
3
Escherichia coli str. K-12 substr. MG1655
Candidatus Gracilibacteria bacterium 28_42_T64
Mycoplasma pneumoniae M29
4
Старт-кодон
Мы можем наблюдать, что:
1. Преобладающим стартовым кодоном является каноничный ATG.
2. Помимо ATG можно встретить GTG и TTG. Их появление могла вызвать какая-либо мутация, но т.к. мутация мононулеотидная, на похожие основания, то по причие эффекта вобблинга/наличия сильного праймера отбор не произошёл. А возможно отбор и прошёл, но изменились полимеразы.
3. Помимо ATG, CTG, TTG мы можем обнаружить редкие альтервнативные старт-кодоны. Возможно это мутации в псевдогенах или артефакт.
5
ATG 38901129629
6
GTG 3384160
7
TTG 802353
8
ATT 408
9
TTC 100
10
CTG201
11
ATC001
12
CTC002
13
ATA004
14
GGA001
15
ACT001
16
CAA002
17
AAA001
18
TTA003
19
GTT001
20
TCT011
21
GAA001
22
TCA010
23
ACA010
24
Последовательности с неконечным стоп-кодоном
Обяснение:
1. Локус b4587 является псевдогеном и необычное расположение стоп-кодона может объясняется, тем что он и нарушил функционал гена.
2.Остальные последовательности рабочие. Значит стоп-кодонв них кодирует аминокислоту селено-цистеин в активном центр дегидрогеназы
25
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
26
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
27
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
28
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
29
Стоп-кодон
Мы можем наблюдать, что TGA не выражен у Gracilibacteria и Mycoplasma. Это объясняется тем, что у Mycoplasma UGA кодирует триптофан [1], а у Gracilibacteria глицин [2].
1. Yamao F. et al. UGA is read as tryptophan in Mycoplasma capricolum //Proceedings of the National Academy of Sciences. – 1985. – Т. 82. – №. 8. – С. 2306-2309.
2.Seligmann H. Phylogeny of genetic codes and punctuation codes within genetic codes //Biosystems. – 2015. – Т. 129. – С. 36-43.
30
TGA124210
31
TAA27611000533
32
TAG306188221
33
Кодоны лейцина
Мы можем наблюдать, различную частоту использования тех или иных кодонов среди наших бактерий. Это может свидетельстовать о:
1. Особенностях метаболизма, в частности необходимости конкретных кодонов под конретную тРНК, что может зависеть от питания.
2. О GC-составе бактерии.
34
TTA185051476710308
35
TTG1829932375572
36
CTT1472893332789
37
CTC1495239683139
38
CTA520333572852
39
CTG7130417142474
40
cumulative GC-skew
Мы может наблюдать два пика GC-skew. Пик максимума - точка окончания терминации, богата GC. Пик минимума - ориджин. Согласно Genbank oriC назодится на 3926012..3926455, что близко.
41
coordinates
GC-Scew в окне(справа от указанной координаты)
c-GC-ScewMax47,7331513000
42
00,0360,036Min-28,3283870000oriC
3926012..3926455
43
10000,0370,073
44
20000,0380,111
45
30000,0380,149
46
40000,0390,188
47
50000,040,227
48
60000,0420,269
49
70000,0420,311
50
80000,0420,353
51
90000,0420,394
52
100000,0410,436
53
110000,0430,479
54
120000,0430,522
55
130000,0430,565
56
140000,0430,608
57
150000,0420,65
58
160000,0410,691
59
170000,0410,732
60
180000,0420,774
61
190000,040,814
62
200000,0410,855
63
210000,0410,896
64
220000,040,937
65
230000,040,976
66
240000,0391,016
67
250000,0391,055
68
260000,0391,094
69
270000,041,133
70
280000,041,174
71
290000,0391,213
72
300000,041,253
73
310000,041,293
74
320000,041,333
75
330000,041,373
76
340000,041,413
77
350000,041,453
78
360000,0431,496
79
370000,0441,54
80
380000,0451,585
81
390000,0451,63
82
400000,0451,675
83
410000,0461,721
84
420000,0471,769
85
430000,0471,816
86
440000,0481,864
87
450000,0481,912
88
460000,0471,959
89
470000,0462,005
90
480000,0472,052
91
490000,0442,097
92
500000,0442,141
93
510000,0452,186
94
520000,0452,231
95
530000,0452,275
96
540000,0442,319
97
550000,0442,363
98
560000,0442,407
99
570000,0442,451
100
580000,0432,494