Published using Google Docs
Что такое гаплогруппа
Updated automatically every 5 minutes

Что такое гаплогруппа

Текст написан максимально упрощенно, специально для тех, кто впервые сталкивается с гаплогруппами и другими сложными понятиями. Местами вы встретите относительно сложные термины, однонуклеотидный полиморфизм итд. Не старайтесь вникнуть и разобраться, что это такое, нужно время, чтобы это понять. Текст в основном скомпилирован из различных источников, местами плохо структурирован, поэтому вы можете встретить повторения одних и тех же терминов в разном изложении.

От отца к сыну в практически неизменном виде передается одна хромосома, така называемая Y хромосома. Он есть только у мужчин. Анализ этой Y хромосомы позволяет проследить историю рода вплоть до десятков тысяч лет.

Исследования ДНК человека показали, что все живущие на планете люди являются потомками одного мужчины и одной женщины, которых условно называют Адамом и Евой. Жили они где-то на территории Восточной Африки сотни тысяч лет назад. Со временем их потомки стали расселяться из Африки, сформировав отдельные ветви человечества. Из поколение в поколение в мужской и женской ДНК произошли необратимые изменения, позволяющие чётко отличать одну ветвь от другой.

В ДНК человека 46 хромосом, каждый человек наследует половину хромосом от отца, половину – от матери. Из 23 хромосом, полученных от отца, только в одной – мужской Y-хромосоме – содержится набор который передается из поколения в поколение почти без изменений в течение тысячелетий.

Набор ДНК передающийся по наследству без изменений называют гаплогруппой. Люди одной гаплогруппы имеют одного общего для них предка в далекой предыстории. На сегодня известно 20 основных мужских линий человечества, которые называют Y-гаплогруппами и для удобства обозначают латинскими буквами от A до T. Y‑хромосома помогает разобраться и в таких вопросах, как миграция племен, происхождение и взаимное родство этнических групп. Тут полезна не только неизменность Y‑хромосомы, но и ее изменчивость. Эти 20 родов в свою очередь разветвляются на более мелкие подветви – субклады, обозначаемые цифрами и буквами – SNP (single nucleotide polymorphism, однонуклеотидный полиморфизм, «снип»).

На картинке ниже вы можете увидеть маршруты основных Y гаплогрупп человечества.


Чуть усложним текст. В конце документа вы найдете определения основных понятий. Сейчас мы остановимся 2 важных понятия. STR и SNP. Эти два термина на самом деле главное оружие для наших исследованиях. Разобравшись в них, вы поймете главное. В чем же ключевое отличие?

STR это короткие повторяющиеся последовательности. ДНК-мо­ле­ку­лу как бы «за­еда­ет», и ко­рот­кая по­сле­до­ва­тель­ность ос­но­ва­ний по­вто­ря­ет­ся несколь­ко раз. Чис­ло по­вто­ров пе­ре­да­ет­ся по на­след­ству и у раз­ных лю­дей раз­ли­ча­ет­ся. По­след­нее де­ла­ет STR удоб­ным ин­стру­мен­том для иден­ти­фи­ка­ции лич­но­сти по ДНК и уста­нов­ле­ния род­ства. Все те цифры которые вы можете увидеть в различных проектах, (например нашем) это и есть последовать STR маркеров. 12 22 15 3-6 итд. C помощью STR обычно изучают современные родственные связи, а также не слишком древние — в пределах последних 4000 лет.

SNP (снипы) же удобно работать и на больших временных расстояниях. Можно ли сказать, что снип — то же самое, что точечная мутация? И да, и нет. Мутация — событие разовое, она наблюдается у отдельных индивидов и их потомков, а полиморфизмом договорились считать варианты, которые встречаются достаточно часто, в том числе у людей, не являющихся близкими родственниками. (Конечно, «достаточно часто» — понятие несколько неопределенное; одни говорят, что мутация, чтобы иметь право называться SNP, должна встречаться в популяции с частотой более 1%, другие — с частотой более 5%. Но ясно, что чем больших успехов мы достигнем в секвенировании геномов, тем более редкие снипы сможем выявлять.)

Каждый снип — это везучая мутация, которая сумела широко распространиться, но не каждая мутация становится снипом: большинство из них пропадает уже в ближайших поколениях.

В то же время рано или поздно каждый снип в ходе эволюции либо зафиксируется, вытеснив другие варианты, либо исчезнет (за исключением редчайших случаев балансирующего отбора). Но мы, жители данного мгновения в истории нашего вида, видим в геномах одних людей в определенной позиции Т, в геномах других — А. И если все, у кого Т, — отдаленные потомки одного человека, первого носителя этой мутации, — это можно использовать для исторических (и даже доисторических) изысканий.

Изучение наборов SNP в геномах множества людей позволяет понять, кто от кого произошел. Точно так же специалисты по древней литературе, сравнивая различные экземпляры рукописных книг, определяют, в каком порядке были изготовлены копии, какая с какой списана. Чем древнее замена, тем у более разнообразных народов она встречается. Сходные наборы SNP намекают на родство между популяциями, аналогичным образом можно понять, является ли одна из них предковой по отношению к другой. Конечно, такие сравнения в большом массиве данных делаются не на глазок, тут не обойтись без биоинформатики.

С помощью этого метода — исследуя только геномы современных людей — ученые узнают, например, что переселение народов с континента на Британские острова происходило и после мезолита, но до римлян, и что «кельты» — не единая популяция, а несколько субгрупп. Узнали, что индонезийцы заселили Мадагаскар раньше, чем африканцы. И как древние сибирские народы проникли в Северную Америку и надолго ли они задержались в Берингии… На самом деле таких исследований множество, я выбрала первые попавшиеся.

Почему снипы, а не наши любимые короткие тандемные повторы STR? Действительно, STR определяют родственные связи при установлении отцовства, идентичность человека при расследовании уголовных дел и т. п. По их сходству можно судить и о родстве этнических групп. Однако изменения числа STR происходят чаще, чем точечные мутации, порождающие SNP.

Наиболее эффективно параллельное исследование обеих генетических систем — SNP и STR. Их образно сравнивают с часовой и минутной стрелкой: первая (SNP) позволяет понять положение образца на родословном древе в «глобальном» масштабе, а вторая (STR) — определить его более точное положение.

Важно, что на большинство маркеров, изучаемых генетиками для реконструкции истории народов, практически не действует отбор, поскольку они сами не влияют на активность каких-либо важных генов, например не вызывают предрасположенности к заболеваниям. Изменения их частот зависит только от скорости мутаций и от таких явлений, как дрейф генов, эффект основателя и т. п., — другими словами, от того, какая часть племени отправилась покорять новые земли, какая сильнее всех пострадала в конфликте, а какая была покорена мирно и смешалась с завоевателями. То есть именно от тех событий, которые интересуют историков. И по этому критерию Y‑хромосома тоже хорошо подходит: в ней сравнительно немного генов и отбор по ним идет не слишком активно.

Гаплотип - Важно, что на большинство маркеров, изучаемых генетиками для реконструкции истории народов, практически не действует отбор, поскольку они сами не влияют на активность каких-либо важных генов, например не вызывают предрасположенности к заболеваниям. Изменения их частот зависит только от скорости мутаций и от таких явлений, как дрейф генов, эффект основателя и т. п., — другими словами, от того, какая часть племени отправилась покорять новые земли, какая сильнее всех пострадала в конфликте, а какая была покорена мирно и смешалась с завоевателями. То есть именно от тех событий, которые интересуют историков. И по этому критерию Y‑хромосома тоже хорошо подходит: в ней сравнительно немного генов и отбор по ним идет не слишком активно.

Гаплогруппа - группа схожих гаплотипов, имеющих общего предка. Из этого определения понятно, что гаплогруппа может быть и широкой, и узкой. Если взять для рассмотрения только древние, широко распространенные маркеры — такая гаплогруппа может быть у целого народа или даже у представителей нескольких народов. А если добавить к ним новые маркеры, то большая гаплогруппа разделится на несколько гаплогрупп поменьше.

Гаплотип одного человека или гаплогруппу — признаки, общие для группы людей, — можно описать, просто перечислив эти признаки. Например, для STR это будет таблица из двух строчек: числа в верхней обозначают участки с повторами, числа в нижней — 11 11 16 15 13… — показывают, сколько повторов в данном участке. Такие таблицы, на страх гуманитариям, уже начали появляться в публикациях по истории и генеалогии и даже в сетевых дискуссиях — аргумент тем более весомый, что выглядит научно и таинственно.

Для гаплогрупп Y‑хромосомы разработал специальную номенклатуру Y Chromosome Consortium (YCC) — коллектив специалистов, ситематизирующих информацию по эволюции и разнообразию этой хромосомы. Основные гаплогруппы называют заглавными буквами от А до Т, а субклады, на которые они делятся, — цифрами и строчными буквами. (Клада в биологии — группа организмов, включающая всех потомков одного предка, — большая ветвь или маленькая веточка древа жизни. Соответственно, субклада — одна из веточек крупной ветви. Более молодую гаплогруппу иногда называют субкладой более старой гаплогруппы, от которой она произошла.) Используют и другой вариант — к букве гаплогруппы через черточку добавляют буквенно-цифровое обозначение SNP, который определяет эту субкладу.

Предок всех гаплогрупп — так называемый Y‑хромосомный Адам, гипотетический мужчина, от которого получили свои Y‑хромосомы все ныне живущие мужчины. Официальное его имя — «Y‑хромосомный последний общий предок», Y‑chromosomal most recent common ancestor, или Y‑MRCA.

В отличие от библейского Адама, он не был ни первым, ни одиноким — правильнее представлять его членом небольшого племени, другие мужчины которого тоже внесли свой вклад в генофонд человечества, но не оставили доживших до нашего времени потомков по мужской линии. Жил этот везучий человек сотни тысяч лет назад; сейчас большинство оценок попадают в промежуток 200 000–300 000 лет (да, возможно, хромосомный Адам не был анатомически современным человеком, если вид Homo sapiens sapiens моложе, чем он!). Сходные допуски дают для «митохондриальной Евы» — женщины, от которой мы все происходим по материнской линии, хотя и в том и в другом случае оценки у разных авторов могут сильно различаться. Митохондриальная Ева и Y‑хромосомный Адам необязательно должны были жить одновременно — в принципе могли, но вероятность этого, при имеющейся точности оценок, весьма мала.

На рисунке ниже 12-маркерный гаплотип крупнейшей мировой лаборатории Family Tree DNA

Например, маркёр DYS393 (первый по счету на картинке) располагается в позиции 3131152 прямой последовательности игрек-хромосомы (версия GRCh37/hg19). Его тетрануклеотид – AGAT (аденин-гуанин-аденин-тимин). В нашем примере DYS393=12. Это значит, что его повторяющийся мотив включает 12 тандемных повторов.

Различие между мужчинами может быть только в числе повторов. По современным данным, в локусе DYS393 наблюдается от 9 до 17 повторов (в нашем примере – 12).

Если у двух мужчин Y-гаплотипы совпадают, то это означает, что они родственники и происходят от одного предка.

Если совпадают все 12 маркеров, то их предок жил от 1 до 250+ поколений назад. Иначе говоря, это может быть как родной брат (или сын), так и человек, ближайший общий предок с которым жил более 6 тыс. лет назад. Как видим, диапазон очень широкий и лежит вне пределов непрерывного существования большинства современных народов. Чтобы сократить этот временной размах, нужно протестировать большее число маркеров – скажем, не 12, а 37. И если у двух мужчин совпадают 37 маркеров, то диапазон возраста ближайшего общего уже гораздо уже.

Наиболее распространенные варианты в лаборатории FTDNA - 12, 37, 67, 111 и самый продвинутый тест 700 маркеров, так называемый BigY. Сделав 12 маркерный тест, вы получите только самую общую информацию, узнаете к какой гаплогруппе вы относитесь. Серьезной аналитики добиться по такому малому количеству маркеров почти не возможно. С другой стороны, если вы сделали BigY а вашему предполагаемому прямому родственнику только Y12 и получен одинаковый результат, то с высокой степенью вероятности можно утверждать, что остальные значения маркеров будут очень сходны.

На картинке пример результат 37 маркерного теста FTNDA. Как вы можете видеть, последовательность первых 12 маркеров такая же как и при 12 маркерном тесте.

Однако важно понимать, что BigY (Y700) тест это не только STR маркеры. Самый главный его плюс в нахождении SNP. Ты можно привести цитату из выступления основателя лаборатории Yseq Томаса Крана:

“..генотипирование заключается в том, что вы специально смотрите на мутации, позиции которых уже известны, тогда как при секвенировании вы проходите через всю последовательность ДНК, не зная, есть ли мутация или нет. И вы можете найти уже известные мутации, но вы также можете найти новые мутации…”

Т.е. сделав BigY вы получается почти все известные STR маркеры + поиск по известным SNP а также самое важно, поиск новых SNP. У вас могут найти SNP, которых больше ни у кого в мире, на данный момент, не найдено. Они будут названы приватными. В будущем, когда (не если а когда, надеемся) у другого человека найдется схожие SNP им будут присвоены имена и родство можно будет назвать 100%. Вопрос лишь в том, когда жил общий предок. Для выяснение этого, а так же для дополнительного анализа ваших данных, результаты полученные при BigY тесте крайне желательно направить в Российскую компанию Yfull. Они дополнительно анализируют данные и располагают результаты на мировом дереве Yfull. Туда добавляются результаты в не зависимости от лаборатории, где был сделан тест. Это дерево, конечный путь, к которому должен стремиться всякий кто встал на путь исследования происхождения своих предков.

Аутосомные ДНК тесты

Стоимость ДНК теста

Чем больше маркеров протестировано чем лучше, но это отражается и на цене. Несколько раз в год лаборатории устраивают распродажи. Самые значительные в конце апреля и в конце года. Цены существенно снижаются. Вот такое было снижение во время последней распродажи (апрель 2020 г.)

Т.е. BigY снизился до 379$, Y37 до 99$ итд.

Важно еще знать, что даже купив самый простой Y12 тест, а вас есть возможность улучшить его (апгрейд) до более серьезных тестов. И для этого заново заказывать тест не надо. Всего лишь в своем аккаунте оплачиваете новую покупку. Там тоже свои цены:

Т.е. во время распродажи вы могли сделать апгрейд Y12 до Y37 доплатив 59$. Итоговая цена получится 59 (если вы Y12 тоже купили по распродаже и доставка была бесплатной, обычно она стоит 10$) + 59$ = 118 (128). А можно было сразу за 99 Y37 купить. Поэтому если вы уже знаете, что будете делать самый продвинутый тест, то выгоднее всего купить сразу самый дорогой, во время распродаж.

BigY не дешевый тест, но одного теста достаточно но весь ваш род, если у вас есть общее древо и вы точно знаете, что все вы от одного предка. И вашим сыновьям тоже уже не нужно будет делать такой тест.

Черкесский ДНК проект

Даже сделав самый дорогой тест, вы скорее всего мало что поймете. Нужно приложить время и не мало усилий, чтобы разобраться в нюансах. Но есть хорошая новость. Всю аналитическую работу вам бесплатно помогут сделать в Черкесском ДНК проекте.

Ссылка на группу в Facebook

Ссылка на проект на сайте FTDNA

Там же вы можете посмотреть результаты членов проекта в таблице

В левой части Фамилии, краткая информация по генеалогии, страна и название гаплогрупп.

В правой части те самые маркеры. Там где их меньше, это 12 маркерный тест и тд.

ОСНОВНЫЕ ПОНЯТИЯ

Аллели - (от греч. ἀλλήλων — друг друга, взаимно) — различные формы одного и того же гена, расположенные в одинаковых участках (локусах) гомологичных хромосом и определяющие альтернативные варианты развития одного и того же признака. В диплоидном организме может быть два одинаковых аллеля одного гена, в этом случае организм называется гомозиготным, или два разных, что приводит к гетерозиготному организму.

Гаплотип (сокр. от «гаплоидный генотип») — совокупность аллелей на локусах одной хромосомы, обычно наследуемых вместе. Если же при кроссинговере комбинация аллелей меняется (что происходит очень редко), говорят о возникновении нового гаплотипа. Гаплотип может быть как у одного локуса, так и у целого генома. Генотип определенных генов диплоидной особи состоит из двух гаплотипов, расположенных на двух хромосомах, полученных от матери и отца соответственно.

В генетической генеалогии гаплотипом также называют результат исследования STR-маркеров на нескольких локусах Y хромосомы, при этом количество повторов называется аллелем.

Гаплотип может  иметь такой вид: 13-25-16-11-11-14-12-12-10-13-11-30 для локусов: DYS393-DYS390-DYS19-DYS391-DYS385a-DYS385b-DYS426-DYS388-DYS439-DYS389I-DYS392-DYS389II.

Гаплогруппа (в популяционной генетике человека, науке, изучающей генетическую историю человечества) — группа схожих гаплотипов, которые разделяют также общий полиморфизм одного нуклеотида. Термин «гаплогруппа» широко применяется в генетической генеалогии, где изучаются гаплогруппы Y-хромосомные (Y-ДНК), митохондриальные (мтДНК) и ГКГ-гаплогруппы. Генетические маркеры Y-ДНК передаются с Y-хромосомой исключительно по отцовской линии (то есть от отца сыновьям), а маркеры мтДНК — по материнской линии (от матери всем детям).

Y-хромосомная гаплогруппа определяет совокупность мужчин, объединенных наличием такого маркера, т.е. происходящих от общего предка-патриарха, у которого много тысяч лет назад случилась специфическая мутация Y-хромосомы.

Генотип — совокупность генов данного организма, которая, в отличие от понятий генома и генофонда, характеризует особь, а не вид (ещё отличием генотипа от генома является включение в понятие «геном» некодирующих последовательностей, не входящих в понятие «генотип»). Вместе с факторами внешней среды определяет фенотип организма.

Гены – это определенные участки ДНК, которые содержат информацию о кодирование белка (РНК). Гены ответственны за все процессы происходящие в организме и за внешние признаки, как то цвет глаз, форма носа и тд. Даже характер определяется наследственно – генами. Однако, большая часть ДНК не содержит ген, и ее называют “мусорной частью”.

ДНК — (ДезоксирибоНуклеиновая Кислота) — это проводник нашей генетической информации, и передается от поколения к поколению всем потомкам. Все клетки нашего организма, за исключением красных кровяных клеток содержат копию нашего ДНК.

Во время зачатия человек получает ДНК как от отца, так и от матери. Каждый из нас имеет 23 хромосомы. Из каждой пары одна была получена от отца и одна от матери. Эти 23 хромосомы известны как ядерные ДНК, потому что находятся в ядре каждой клетки (кроме красных кровяных клеток). 23-я хромосома — это половая хромосома. От матери — всегда Х-хромосома. От отца ребенок унаследует или Х-хромосому, или Y-хромосому. X-хромосома от отца превращается в комбинацию XX — и это женский пол. Y-хромосома от отца превращается в комбинацию XY, и задает мужской пол. Мы также наследуем митохондриальную ДНК (мтДНК) от матери, и ни одной от отца. Митохондриальная ДНК расположена вне ядра клетки.

ДНК состоит из четырех оснований: аденин (А), цитозин (C), тимин (T) и гуанин (G). Порядок этих оснований называется ДНК последовательностью. Всякий раз, когда специфическое основание есть на одной стороне спирали, ее дополнительное основание находится на другой. На примере (см. иллюстрацию) показано, как основания всегда имеют дополнительную пару. Гуанин (зеленый) всегда пара с цитозином (красный), а тимин (желтый) пара для аденина (синий). Поэтому мы можем записывать ДНК последовательность по любой из двух спиралей. В приведенном примере одна сторона читается как: A G T T C C A G, а другая автоматически — это T C A A G G T C.

Все хромосомы подвергнуты смешиванию (рекомбинации) – это сложный процесс, когда каждая пара хромосом обменивается различными фрагментами друг с другом, но есть одна хромосома, которая передается в неизменном виде из поколения в поколение из тысячелетия в тысячелетие – эта “половая” хромосома называется Y-хромосома.

ДНК-маркеры  или молекулярно-генетические маркеры, полиморфный признак, выявляемый методами молекулярной биологии на уровне нуклеотидной последовательности ДНК, для определенного гена или для любого другого участка хромосомы при сравнении различных генотипов, особей, пород, сортов, линий и тд. За последние годы накопился большой массив данных об эффективности использования молекулярно-генетических маркеров, как на уровне белков, так и ДНК, РНК, для решения многих задач генетики, селекции, сохранения биоразнообразия, изучения механизмов эволюции, картирования хромосом, а также для семеноводства и племенного дела.

ДНК-генеалогия — то же, что и Молекулярная генеалогия, и Генетическая генеалогия. Использует мутации Коротких Тандемных Повторов (STR) на участках Y-хромосомы для реконструкции исторических событий прошлого человечества, миграционных процессов носителей определенных гаплогрупп. Для индивидов ДНК-генеалогия помогает установить являются ли, например, однофамильцы родственниками, и по количеству накопленных мутаций в STR-гаплотипе как давно группа, или два индивида имели общего предка по прямой мужской линии, другими словами позволяет проследить генеалогию намного дальше обозримого «документального горизонта».

DYS — в переводе с анг. (DNA Y-chromosome segment) это участок ДНК на Y-хромосоме. Обычно абривеатура DYS находится вместе с номером участка ДНК, например, №391 и записывается как DYS391.

Кроссинговер (другое название в биологии перекрёст) — процесс обмена участками гомологичных хромосом во время конъюгации в профазе I мейоза. Помимо мейотического, описан также митотический кроссинговер.

Локус в биологии означает фиксированное положение (локализацию) на хромосоме, например положение гена. Вариант последовательности ДНК в данном локусе называется аллелью. Упорядоченный перечень локусов для какого-либо генома называется генетической картой. Генное картирование — это определение локусa для специфического биологического признака.

Мутация — точечное изменение генотипа, которое передается всем потомкам клетки, или организма. Мутации происходят под влиянием внешней, или внутренней среды. Изменение аллеля в Y-хромосомном локусе DYS391 c 12 повторов на 13 повторов является мутацией. Также замена одного нуклеотида другим — называется SNP мутацией. Мутации также могут быть и в митохондриальной ДНК.

Му­та­ции — это слу­чай­ные из­ме­не­ния в мо­ле­ку­ле ДНК, ко­гда опре­де­лен­ные еди­ни­цы — азо­ти­стые ос­но­ва­ния — за­ме­ня­ют­ся, ис­че­за­ют или до­бав­ля­ют­ся. В каж­дом но­вом по­ко­ле­нии лю­дей про­ис­хо­дит око­ло трид­ца­ти но­вых му­та­ций. Чем стар­ше отец, тем боль­ше му­та­ций бу­дет у ре­бен­ка. В ми­то­хон­дри­ях одна му­та­ция в од­ной род­ствен­ной ли­нии про­ис­хо­дит в сред­нем раз в две ты­ся­чи лет.

Полиморфизм в биологии (от др.-греч. πολύμορφος — многообразный) — способность некоторых организмов существовать в состояниях с различной внутренней структурой или в разных внешних формах.

Внешний (а также внутренний, например, биохимический) полиморфизм может быть обусловлен внутривидовыми генетическими различиями. С другой стороны, возможен полиморфизм, при котором организмы с практически идентичным геномом в зависимости от внешних условий приобретают различные фенотипические формы.

 

SNP–полиморфизм – однонуклеотидный полиморфизм ( SNP ) представляет собой  изменения последовательности ДНК, происходящие при одном нуклеотиде — А, T , C и G — в геноме (или в другой сравниваемой последовательности) представителей одного вида или между гомологичными участками гомологичных хромосом индивида. Например, два последовательный фрагментов ДНК от разных людей, AAGCCТА AAGCТТА, содержащие различия в один нуклеотид. В этом случае говорят о существовании двух аллелей : C и T. SNP возникают в результате точечных мутаций.

STR — короткий тандемный повтор (буквальный перевод англ. short tandem repeat, STR) — повтор двух или более пар непосредственно примыкающих друг к другу нуклеотидов в последовательности ДНК. Например, в локусе DYS391 может быть 12 повторов из четырех нуклеотидов … TCTA TCTA TCTA TCTA TCTA TCTA TCTA TCTA TCTA TCTA TCTA TCTA … Такое количество повторов можно записать как DYS391=12.

В чем разница между SNP и STR?

SNP: single nucleotide polymorphism

Название говорит нам, что это изменение влияет на один нуклеотид и может быть кратно из них ( полиморфизм может быть переписан как несколько форм )

На странице страницы Википедии SNP :

[SNP] - это вариация последовательности ДНК, возникающая, когда один единственный нуклеотид - A, T, C или G - в геноме (или другой общей последовательности) отличается от членов биологического вида или парных хромосом у человека. </р>

Так, например, если вы берете 8 особей и упорядочиваете их ген XYZ, вы можете найти в определенном локусе (= position) на гене:

Индивидуальный 1: AAGGTG C AGCAGTC

Индивидуальный 2: AAGGTG T AGCAGTC

Индивидуальный 3: AAGGTG T AGCAGTC

Индивидуальный 4: AAGGTG T AGCAGTC

Индивидуальный 5: AAGGTG C AGCAGTC

Индивидуальный 6: AAGGTG C AGCAGTC

Индивидуальный 7: AAGGTG T AGCAGTC

Индивидуальный 8: AAGGTG T AGCAGTC

Позиция, выделенная полужирным шрифтом, представляет собой SNP. В этом случае мы имеем только C или T (и это дает 2 разных аллеля для гена XYZ).

STR: short tandem repeat

Это короткие повторяющиеся последовательности. Они в тандеме , то есть один за другим.

STR состоит из нескольких (2-6) нуклеотидов, которые повторяются несколько (5-100) раз.

Например, эта страница из Университета Аризоны дает пример D7S280, одна STR с последовательностью (GATA) n (т. Е. GATA повторяется n раз)

 1 aatttttgta ttttttttag agacggggtt tcaccatgtt ggtcaggctg actatggagt

 61 tattttaagg ttaatatata taaagggtat gatagaacac ttgtcatagt ttagaacgaa

121 ctaacgatag atagatagat agatagatag atagatagat agatagatag atagacagat

181 tgatagtttt tttttatctc actaaatagt ctatagtaaa catttaatta ccaatatttg

241 gtgcaattct gtcaatgagg ataaatgtgg aatcgttata attcttaaga atatatattc

301 cctctgagtt tttgatacct cagattttaa ggcc

В этом случае различия между индивидуумами находятся в количестве повторений последовательности.

Еще раз про STR и SNP

Что та­кое STR?

Со­кра­ще­ние от ан­глий­ско­го «short tan­dem re­peats». Это ме­сто, где ДНК-мо­ле­ку­лу как бы «за­еда­ет», и ко­рот­кая по­сле­до­ва­тель­ность ос­но­ва­ний по­вто­ря­ет­ся несколь­ко раз. Чис­ло по­вто­ров пе­ре­да­ет­ся по на­след­ству и у раз­ных лю­дей раз­ли­ча­ет­ся. По­след­нее де­ла­ет STR удоб­ным ин­стру­мен­том для иден­ти­фи­ка­ции лич­но­сти по ДНК и уста­нов­ле­ния род­ства. На­чи­ная с 1980-х го­дов STR ис­поль­зу­ют при рас­сле­до­ва­нии уго­лов­ных дел; сей­час ме­то­ди­ка при­ме­ня­ет­ся так­же в со­став­ле­нии ро­до­слов­ных, осо­бен­но для срав­не­ния Y-хро­мо­сом. По­сколь­ку меж­ду STR и на­след­ствен­ны­ми ка­че­ства­ми нет ви­ди­мой свя­зи, об­ра­ще­ние к STR обыч­но не вы­зы­ва­ет спо­ров. Ком­мер­че­ские те­сты Y-хро­мо­сом — Y-DNA37, Y-DNA67 и Y-DNA111 — под­считы­ва­ют чис­ло по­вто­ров в 37, 67 и, со­от­вет­ствен­но, 111 ме­стах вдоль Y-хро­мо­со­мы. Чем выше циф­ра, тем боль­ше точ­ность и, сле­до­ва­тель­но, тем бли­же к со­вре­мен­но­сти мо­жет по­дой­ти ге­не­а­лог. Ком­про­мисс­ным ва­ри­ан­том с точ­ки зре­ния цены мо­жет быть ана­лиз сред­не­го ко­ли­че­ства STR, до­пол­нен­ный те­стом на так на­зы­ва­е­мые «сни­пы» — SNP.

Что та­кое SNP?

SNP (аб­бре­ви­а­ту­ра от ан­глий­ско­го «sin­gle nu­cleotide poly­mor­phism») — раз­ли­чие меж­ду дву­мя по­сле­до­ва­тель­но­стя­ми в один нук­лео­тид (одно азо­ти­стое ос­но­ва­ние). Чис­ло та­ких SNP, или, как их в про­сто­ре­чии на­зы­ва­ют, «сни­пов», опре­де­ля­ет раз­ли­чие меж­ду дву­мя по­сле­до­ва­тель­но­стя­ми ДНК. Вме­сто ис­сле­до­ва­ния всей ДНК мож­но про­ве­сти ана­лиз ка­ко­го-то ко­ли­че­ства та­ких от­ли­чий, так на­зы­ва­е­мый SNP-ана­лиз, это про­ще и де­шев­ле. Сни­пы уже дав­но при­ме­ня­ют­ся в ме­ди­цинских ис­сле­до­ва­ни­ях, а те­перь пе­ре­шли и в ар­се­нал ге­не­а­ло­гов. SNP-те­стов ты­ся­чи, и преж­де чем де­лать за­каз, сто­ит по­со­ве­то­вать­ся со спе­ци­а­ли­стом, что­бы опре­де­лить, ка­кой тест наи­бо­лее ре­ле­ван­тен в каж­дом от­дель­ном слу­чае.

Субклад – термин, используемый для описания ветви гаплогруппы, носители одного и того же субклада, в исторической перспективе, являются генетическими родственниками. Учитывая место и плотность проживания предков представителей одного и того же субклада и имея данные древней ДНК региона, можно попытаться связать определенную общность ныне живущих людей с какой-либо археологической культурой.

Фенотип (от греческого слова phainotip — являю, обнаруживаю) — совокупность характеристик, присущих индивиду на определённой стадии развития. Фенотип формируется на основе генотипа, опосредованного рядом внешне средовых факторов. У диплоидных организмов в фенотипе проявляются доминантные гены.

Фенотип — совокупность внешних и внутренних признаков организма, приобретённых в результате онтогенеза (индивидуального развития).

Хромосомы (др.-греч. χρῶμα — цвет и σῶμα — тело) — нуклеопротеидные структуры в ядре эукариотической клетки (клетки, содержащей ядро), которые становятся легко заметными в определённых фазах клеточного цикла (во время митоза или мейоза). Хромосомы представляют собой высокую степень конденсации хроматина, постоянно присутствующего в клеточном ядре. Исходно термин был предложен для обозначения структур, выявляемых в эукариотических клетках, но в последние десятилетия всё чаще говорят о бактериальных хромосомах. В хромосомах сосредоточена большая часть наследственной информации.

Y-хромосома — половая хромосома большинства млекопитающих, в том числе человека. Содержит ген SRY, определяющий мужской пол организма, а также гены, необходимые для нормального формирования сперматозоидов. Y-хромосома человека состоит приблизительно из 58 миллионов пар азотистых оснований.

Аутосомы - ДНК в ядре ор­га­ни­зо­ва­на в хро­мо­со­мы. У че­ло­ве­ка их 23 пары. В паре хро­мо­сом одна на­сле­ду­ет­ся от отца, дру­гая от ма­те­ри. В слу­чае 22 пар от отца и от ма­те­ри на­сле­ду­ют­ся оди­на­ко­вые хро­мо­со­мы, ко­то­рые от­ли­ча­ют­ся друг от дру­га по по­сле­до­ва­тель­но­сти вхо­дя­щих в их со­став азо­ти­стых ос­но­ва­ний в сред­нем на 0,1%. Они на­зы­ва­ют­ся ауто­со­ма­ми. Са­мые про­стые и де­ше­вые ге­не­ти­че­ские те­сты ос­но­вы­ва­ют­ся на ауто­сом­ных ДНК. Они мо­гут дать ин­фор­ма­цию о бра­тьях и сест­рах, о ро­ди­те­лях, дво­ю­род­ных и тро­ю­род­ных бра­тьях и сест­рах вплоть до седь­мо­го ко­ле­на. Но сов­па­де­ние мож­но опре­де­лить, толь­ко если дру­гие люди тоже про­шли тест. Од­на­ко есть еще хро­мо­со­мы, на­ли­чие ко­то­рых опре­де­ля­ет пол у че­ло­ве­ка. Это так на­зы­ва­е­мые Х- и Y-хро­мо­со­мы.

Х‐хро­мо­со­ма  Это одна из двух по­ло­вых хро­мо­сом. У жен­щи­ны есть толь­ко две Х-хро­мо­со­мы, она пе­ре­да­ет сво­е­му ре­бен­ку X-хро­мо­со­му. А у муж­чин (и это, соб­ствен­но, опре­де­ля­ет их при­над­леж­ность к муж­ско­му полу) есть Х-хро­мо­со­ма от ма­те­ри и Y-хро­мо­со­ма от отца. Если он пе­ре­даст свою Х-хро­мо­со­му бу­ду­ще­му ре­бен­ку, то но­си­тель двух X-хро­мо­сом бу­дет де­воч­кой, а вот если он пе­ре­даст Y-хро­мо­со­му, то по­лу­чит­ся маль­чик.

Ми­то­хон­дрии — так на­зы­ва­е­мые «ор­га­нел­лы» кле­ток, ко­то­рые от­ве­ча­ют за кле­точ­ное ды­ха­ние и обес­пе­чи­ва­ют клет­ки энер­ги­ей, необ­хо­ди­мой для их жиз­не­де­я­тель­но­сти. Они со­дер­жат свою соб­ствен­ную ДНК. Это та­кая неболь­шая коль­це­вая мо­ле­ку­ла, ко­то­рая со­сто­ит толь­ко из 16 000 пар азо­ти­стых ос­но­ва­ний. Ми­то­хон­дрий в клет­ке мно­го, по­это­му и та­ких оди­на­ко­вых мо­ле­кул ДНК в каж­дой клет­ке очень мно­го. Ми­то­хон­дрии в ос­нов­ном пе­ре­да­ют­ся от ма­те­рей к де­тям, по­это­му бла­го­да­ря им мы мо­жем про­сле­дить ма­те­рин­скую ли­нию че­ло­ве­ка на мно­го по­ко­ле­ний на­зад.

Что та­кое ядер­ная ДНК? Ядер­ная ДНК — это, соб­ствен­но, вся осталь­ная, кро­ме ми­то­хон­дри­аль­ной, часть на­шей ДНК, ко­то­рая на­хо­дит­ся в спе­ци­аль­ной ча­сти клет­ки — ядре. Это очень боль­шая мо­ле­ку­ла, она об­ра­зо­ва­на тре­мя мил­ли­ар­да­ми пар азо­ти­стых ос­но­ва­ний. Изу­че­ние ядер­ной ДНК, без­услов­но, дает го­раз­до боль­ше ин­фор­ма­ции. Но, есте­ствен­но, изу­чить по­сле­до­ва­тель­ность та­кой дли­ны го­раз­до слож­нее и до­ро­же. Кро­ме того, не надо за­бы­вать, что ядро в клет­ке одно, а ми­то­хон­дрий очень мно­го. По­это­му если речь идет об «ис­ко­па­е­мой» ДНК, то со­хра­ня­ет­ся в первую оче­редь ми­то­хон­дри­аль­ная ДНК — ее боль­ше и она ко­ро­че.

Что та­кое HVR1 и HVR2? Со­кра­ще­ния для «hy­per­vari­able re­gion» 1 и 2. Это два неболь­ших участ­ка на­ших ми­то­хон­дрий, где му­та­ции про­ис­хо­дят чаще, чем в осталь­ной ДНК. Ис­сле­дуя эти участ­ки, мож­но опре­де­лить, в ка­кую ми­то­хон­дри­аль­ную гап­ло­груп­пу вхо­дит че­ло­век. Но этот ана­лиз дает очень при­бли­зи­тель­ную ин­фор­ма­цию и толь­ко о про­ис­хож­де­нии че­ло­ве­ка по ма­те­рин­ской ли­нии мно­го ты­сяч лет на­зад. Что­бы по­лу­чить дан­ные о бо­лее близ­ком к на­ше­му вре­ме­ни род­стве, тре­бу­ет­ся бо­лее пол­ный и по­дроб­ный ДНК-ана­лиз ми­то­хон­дрий.

Что та­кое CRS и rCRS? Со­кра­ще­ния для Cam­bridge Ref­er­ence Se­quence, ис­поль­зу­ет­ся для срав­не­ния ми­то­хон­дри­аль­ных ДНК. При этом ис­сле­ду­ют, ка­кие му­та­ции от­ли­ча­ют­ся от пер­вой се­кве­ни­ро­ван­ной ми­то­хон­дри­аль­ной ДНК (пер­вое се­кве­ни­ро­ва­ние про­изо­шло в 1970–е годы в Кем­бри­дже). Усо­вер­шен­ство­ван­ный ва­ри­ант на­зы­ва­ет­ся rCRS — re­vised Cam­bridge Ref­er­ence Sys­tem.

Что та­кое RSRS? Со­кра­щен­ное Re­vised Sapi­ens Ref­er­ence Se­quence; это но­вый спо­соб срав­не­ния ми­то­хон­дри­аль­ных ДНК. При­ме­ня­ет­ся с 2012 года. При срав­не­нии ис­хо­дят из по­сле­до­ва­тель­но­сти, ко­то­рую долж­на была иметь, по рас­че­там уче­ных, наша об­щая пра­ро­ди­тель­ни­ца, «ми­то­хон­дри­аль­ная Ева».

Что озна­ча­ют циф­ры и бук­вы в ре­зуль­та­тах ана­ли­за моей ми­то­хон­дри­аль­ной ДНК?

Все это обо­зна­че­ния раз­ных ти­пов му­та­ций. «C40624T», на­при­мер, озна­ча­ет, что азо­ти­стое ос­но­ва­ние ци­то­зин © за­ме­ни­лось ти­ми­ном (Т) в по­зи­ции 40624. Если в на­ча­ле или в кон­це сто­ят А, Т или G, это озна­ча­ет, что эти ос­но­ва­ния тоже сме­ни­лись дру­ги­ми, по срав­не­нию с ре­фе­ренсной си­сте­мой (см. выше, CRS и rCRS).

Ино­гда по­сле букв и цифр сто­ит вос­кли­ца­тель­ный знак: «C40624T!». Это об­рат­ная му­та­ция. Зна­чит, в ис­ход­ной вер­сии у ми­то­хон­дри­аль­ной Евы или в Кем­бридж­ской ре­фе­ренсной по­сле­до­ва­тель­но­сти в этой по­зи­ции сто­я­ло имен­но Т. В бо­лее круп­ной гап­ло­груп­пе — «тол­стой вет­ке» ро­до­слов­но­го дре­ва — это ос­но­ва­ние за­ме­ни­лось дру­гим. Но имен­но та ве­точ­ка, в ко­то­рую вхо­дит ис­сле­до­ван­ная про­ба, по­том му­ти­ро­ва­ла об­рат­но, в ис­ход­ное Т.

Ино­гда на блан­ке с ре­зуль­та­та­ми ана­ли­за мож­но уви­деть, на­при­мер, «315,1» или «315+С». Это озна­ча­ет, что до­пол­ни­тель­ное азо­ти­стое ос­но­ва­ние — в дан­ном слу­чае С — до­ба­ви­лось по­сле по­зи­ции 315. Ан­то­ни­мич­ным на­пи­са­ни­ем бу­дет, на­при­мер, «315D». Здесь D озна­ча­ет delе­tion: азо­ти­стое ос­но­ва­ние в дан­ной по­зи­ции вы­па­ло. Встре­ча­ют­ся и дру­гие обо­зна­че­ния раз­лич­ных част­ных ви­дов му­та­ций.

Терминальный снип (или группа снипов), это снип или несколько снипов, отвечающих следующим требованиям:

- все снипы, входящие в терминальную группу подтверждены, как минимум, у двоих мужчин

- есть хотя бы один мужчина, разделяющий с ними все снипы, которые эти мужчины разделяют, кроме тех, которые составляют эту терминальную группу.

Пример: М1 - 100 снипов, М2 - 101 снип, М3 - 102 снипа.

97 снипов совпадают у всех троих.

У М1 и М2 совпадают ещё 2 снипа  сверх 97-и, а у М3 их нет. Эти 98-й и 99-й снипы образуют терминальную группу.

Кроме того, у М1, М2 и М3 - присутствуют 1, 2 и 5 приватных снипов соответственно.

Дополнительная информация

Презентация ДНК технологии в науке и практике

Как пережить печенегов и половцев: история происхождения Рюриковичей

Вплоть до Адама: генеалогия человечества по мужской линии

Medical genomics ДНК исследование по отцовской линии Исследование Y-хромосомы Иванова И.И

Генеалогический форум ВГД » ДНК-генеалогия » ДНК-генеалогия. Вопросы новичков

Заметки о генетике

Терминология ДНК-генеалогии

Методы детекции SNP

Диссертация - Эволюция генетического разнообразия популяций человека по генам, ассоциированным с иммунозависимыми фенотипами

Диссертация - изменчивость генофонда в пространстве и времени: синтез данных о геногеографии митохондриальной днк и y-хромосомы

23&me и Family Finder от FTDNA - аутосомные тесты, причем у FTDNA они более объемны, чем сегодняшняя 4-я версия от 23&me, которую даже на gedmatch.com нельзя загрузить.

Эти тесты позволяют найти "приближенцев" на глубину до 200 лет.

А как быть тем, кто хочет увидеть более далеких предков? Где они могли жить? Откуда пришли?

Вот тут то и появляется возможность обнаружить "приближенцев" из глубины веков. Особенно это актуально тем, кто уже имеет документальную историю до 18 века. А дальше? Тест игрек ДНК дает такую возможность по ПРЯМОЙ мужской линии, тест мито - по ПРЯМОЙ женской.

А в генеалогии данные по STR и SNP используются как способы достигнуть высокой точности при расчетах родства. Причем, используя SNP, можно получить точность до 50 лет. FTDNA их делает всем заказавшим соответствующий тест. Более глубоко делают в лаборатории Крана и лаборатории Фуллгеномес. В последней могут сделать полностью все хромосомы, как Х, У и аутосомы, с высокой степенью покрытия.

Интерпретацию сделанных в лабораториях глубоких тестов делают в http://yfull.com, которая размещает результаты на Экспериментальном древе, обновляемом ежемесячно.

http://tanmoy.tripod.com/cgi-bin/Ytree/Yfull/index.pl?hap=I2&openathap=I2

http://forum.molgen.org/index.php/topic,10204.msg480553.html#msg480553

Все три пункта - это разные технологии.

1) таргетное секвенирование. Примеры: BigY, FGC Elite

2) WGS. Полный геном. Предоставляют услугу: YSEQ, FGC, Dante

3) Лонг риды. Предоставляют услугу: FGC, Dante

Третий пункт отпадает сразу, так как уже сказали - технология не отлаженная. Я видел лонгриды от Данте очень высокого качества, но видел и совсем трешовые.

Если выбирать между первым и вторым пунктами, то WGS в любом случае лучше. Таргетное секвенирование делали ради удешевления процесса. Теперь, когда цена на WGS упала, выбор очевиден.

Что касается конкретно Данте. Они сильно демпингуют, то есть цена очень привлекательная. Но имеют кучу проблем с логистикой. Так что какую контору выбирать из второго пункта - вопрос толщины кошелька и желания решать возникающие проблемы.

По качеству секвенирования - многое зависит от качества биоматериала. Лайфхак - собирая слюну, попробуйте слегка повредить десны и подмешать крови ;)

Практика показывает увеличение покрытия в глубину.

Для себя я уже решил - на скидках закажу несколько наборов, но уже через шипито.

#J