Славяне, кавказцы, евреи с точки зрения ДНК-генеалогии
Шрифт:
Имя этой науки – ДНК-генеалогия. Ее экспериментальные данные – это картина мутаций в нерекомбинантных участках мужской половой хромосомы (на самом деле – и в митохондриальной ДНК, но в этом очерке речь пойдет только об Y-хромосоме, иначе объем его выйдет за пределы допустимого), причем картина мутаций как в Y-хромосомах отдельных людей, так и их групп, популяций. Методология новой науки – перевод динамической картины мутаций в хронологические показатели, во времена жизни общих предков популяций, а на самом деле – общих предков древних родов и племен. То есть фактически производится расчет времен, когда в древности жили эти рода и племена.
Мутации, рассматриваемые в ДНК-генеалогии –
Мутации второго типа – STR (Short Tandem Repeats, или «короткие тандемные повторы») – значительно более быстрые, и происходят в определенных участках, или локусах, или маркерах (это все синонимы) ДНК раз в несколько десятков или сотен поколений. Набор этих маркеров составляет гаплотип, примеры гаплотипов будут даны ниже. Гаплотип – это по сути цепочка чисел, показывающих число повторов в определенных маркерах. Поэтому гаплотипы ДНК выбирают так, чтобы в них таких маркеров было как можно больше (но все-таки чтобы оставаться в рамках практичности), и в ранних работах использовались 6-маркерные гаплотипы, затем 12-маркерные, 17– и 19-маркерные, затем 25– и 37-маркерные, а сейчас работа рутинно ведется с 67– и 111-маркерными гаплотипами (правда, в академических публикациях это обычно от 8 до 17 маркерных гаплотипов). В 67-маркерных гаплотипах, например, одна мутация происходит в среднем за 8 поколений, в 111-маркерных – за 5 поколений.
Например, предковый гаплотип осетин со снипом Z6638 (в гаплогруппе G2a1, о которой речь пойдет ниже) c «возрастом» 1375±210 лет выглядит так:
14 23 15 9 15 17 11 12 11 11 10 28 17 9 9 12 11 25 16 21 28 13 13 14 14 11 11 19 21 15 15 16 18 37 38 12 9 11 8 15 16 8 11 10 8 12 10 12 21 22 14 10 12 12 15 8 13 21 22 15 13 11 13 10 11 11 13 30 15 8 16 11 23 27 21 9 11 13 13 11 9 10 12 10 11 12 27 10 12 22 14 11 10 24 15 17 14 23 18 12 15 27 12 21 18 11 14 17 9 12 11
А предковый гаплотип карачаево-балкарцев c тем же снипом и в той же гаплогруппе, с «возрастом» 4650±750 лет, но в 67-маркерном формате (111-маркерных гаплотиппов карачаево-балкарцы себе не определяли), имеет вид:
14 22 15 10 15 16 11 12 11 12 10 29 17 9 9 11 11 25 16 21 29 13 13 14 14 10 10 20 21 15 15 15 18 36 38 11 10 11 8 15 16 8 11 10 8 12 10 12 21 22 14 10 12 12 15 8 13 21 22 16 13 11 13 10 11 11 13
Между этими предковыми гаплотипами – 14 мутаций на первых 67 маркерах. Это очень много, и это разводит их общих предков на 14/0.12 = 117 -> 133 условных поколений (по 25 лет каждое), то есть примерно на 3325 лет, и их общий предок жил примерно 4675 лет назад. Но это и есть «возраст» общего предка карачаево-балкарцев гаплогруппы G2a1, к которой относится треть всего народа, точнее, его мужской половины. Иначе говоря, и карачаево-балкарцы, и осетины гаплогруппы G2a1 происходят от одного общего предка, который жил в первой половине III тыс до н. э. Осталось выяснить, где он жил, и это ДНК-генеалогия тоже способна определить. Состояние ответа на сегодняшний день – это историческая Бактрия, область на сопредельных территориях Узбекистана, Таджикистана и северного Афганистана. Именно там современные жители той же гаплогруппы имеют подобные предковые гаплотипы. В формуле выше 0.12 (мутаций на гаплотип за условное поколение) – это константа скорости мутаций для 67-маркерных гаплотипов, стрелка показывает табличную поправку на возвратные мутации. Это упрощенный пример, потому что по двум гаплотипам расчеты обычно не ведут, ведут по десяткам и сотням гаплотипов, если таковые есть в наличии, рассчитывают математические погрешности в определяемых цифрах, и т. д. Здесь только иллюстрируется принцип расчета.
В гаплотипах, приведенных выше, первое число показывает, что в одном из маркеров Y-хромосомы определенная последовательность нуклеотидов повторяется 14 раз. В другом маркере, который здесь показан как следующий, блок нуклеотидов повторяется 23 раза у осетин, и 22 раза у карачаево-балкарцев, и так далее. Чтобы показать, что все это на самом деле четко определено и зафиксировано, [6] добавим, что в первом маркере (под названием DYS393) повторяется четверка нуклеотидов AGAT, то есть аденин-гуанин-аденин-тимин
6
Интернет-сайт Sorenson Molecular Genealogy Foundation. URL: http://www.smgf.org/ychromosome/marker_details.jspx?marker.
GTGGTCTTCTACTTGTGTCAATAC/AGAT/AGAT/AGAT/AGAT/ AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/AT GTATGTCTTTTCTATGAGACATACCTCATTTTTTGGACTTGAGTTC
и эти повторы обрамляются уже неупорядоченными последовательностями нуклеотидов в ДНК, как показано выше. Во втором маркере, под названием DYS390, повторяется уже другая четверка, TCTG, то есть тимин-цитозин-тимин-гуанин, которая переходит в четверку TCTA, то есть тимин-цитозин-тимин-аденин, и число повторов складывается (здесь показана последовательности для 22 повторов, как у карачаево-балкарцев):
TATATTTTACACATTTTTGGGCCCTGCATTTTGGTACCCCATAA TATATTCTATCTA/TCTG/TCTG/TCTG/TCTG/TCTG/TCTG/TCTA/ TCTA/TCTA/TCTA/TCTATCTA/TCTA/TCTA/TCTA/TCTA/TCTA/ TCTA/TCTG/TCTA/TCTA/TCTA/TCATCTATCTATCTTTCCTTGTTT CTGAGTATACACATTGCAATGTTTTCATTTTACTGTCAC
Перечисленные четыре нуклеотида – это язык ДНК, который состоит из этих четырех слов, или четырех букв, при сокращенной записи. Эти нуклеотиды комбинируются парами, и их так и называют – «пары оснований». Они фактически держат двойную спираль ДНК.
Нам эти четверки (а также тройки нуклеотидов, и другие типы повторов) в маркерах ДНК в дальнейшем не понадобятся, это описание мы даем только для того, чтобы показать, что за числами в гаплотипах стоят масштабные исследования, которыми занимаются в мире сотни и тысячи человек.
Гаплотипы ДНК выбирают так, чтобы в них таких маркеров было как можно больше (но все-таки чтобы оставаться в рамках практичности), и в ранних работах использовались 6-маркерные гаплотипы, затем 12-маркерные, 17– и 19-маркерные, затем 25– и 37-маркерные, а сейчас работа рутинно ведется с 67– и 111-маркерными гаплотипами (правда, в академических публикациях это обычно от 8 до 17 маркерных гаплотипов).