Рейтинговые книги
Читем онлайн Кому мешает ДНК-генеалогия? - Анатолий Клёсов

Шрифт:

-
+

Интервал:

-
+

Закладка:

Сделать
1 ... 29 30 31 32 33 34 35 36 37 ... 167

При сопоставлении расчетных констант по большой серии гаплогрупп такие искажения должны быть заметны, проанализированы, и если причина выяснена и действительно показано, что это искажения, то эти выпадающие величины должны быть приняты во внимание. Таким образом видно, что это кропотливая и большая работа. Дилетанты или прочие любители обычно выхватывают одну серию гаплотипов, делят одно на другое, без всяких перекрестных проверок и размышлений, и вуаля, ответ готов. Он часто такой – «расчеты по мутациям смысла не имеют». Пример такой дилетантской (в данном отношении) статьи Busby et al (2011)[60], сюда же относятся неквалифицированные рассуждения Dienekes Pontikos[61], и прочих. Они основывались именно на выхватывании отдельных величин, которые оказались искаженными, и отсюда делались «глобальные» негативные выводы. По аналогии, можно бросить монету три раза, и на основании полученного результата объявить теорию вероятности «псевдонаукой».

Проще с протяженными гаплотипами, в первую очередь 67– и 111-маркерными, в которых искажения в индивидуальных маркерах, которые (искажения) также имеют статистический характер, уравновешиваются, компенсируются на множестве маркеров, и в итоге дают взаимно согласованные данные. Примеры (показаны датировки протяженных серий 111-маркерных гаплотипов, первая колонка – 67-маркерные гаплотипы, вторая – 111-маркерные), датировки без округления:

Часто спрашивают, а сохраняются ли константы скоростей мутаций в других гаплогруппах и субкладах? Ответ – естественно, сохраняются, так как откуда, например, маркер DYS393 «знает», какая там снип-мутация имеется на другом конце Y-хромосомы, и которая определяет носителя Y-хромосомы в определенный субклад? Маркер есть маркер, это обычно три– или тетра-нуклеотид, повторяющийся определенное количество раз в Y-хромосоме. Раз в несколько тысяч лет он удлиняется или укорачивается на одно (обычно) звено, и что ему до удаленной снип-мутации? Но люди интересуются, обычно не задумываясь о таких деталях, им представляется, что гаплогруппа – это что-то большое и материальное, вляющее на скорости мутации во всей Y-хромосоме каким-то чудодейственным образом.

Еще пример – субклад R1b-M222, в котором 818 аллелей маркера DYS393 распределяются следующим образом:

12 – 5

13 – 791

14 – 22

Число мутаций (от базового значения маркера) равно 27, что дает 27/818/0.00059 = 56 → 57 условных поколений, или 1425±310 лет до общего предка. По данным расчета по снипам субклад R1b-M222 образовался 4300 лет назад (http://www.yfull. com/tree/R1b/), но популяция прошла бутылочное горлышко, и общий предок современных носителей R1b-M222 жил на три тысячи лет позже. Такое бывало довольно часто.

Еще один непростой пример – гаплогруппа J2. Пример непростой, потому что гаплогруппа древняя, и состоит из многих обрывков ДНК-генеалогических линий, которые усложняют расчеты. Посмотрим, насколько однородный там набор из 587 аллелей маркера DYS393, которые распределяются следующим образом:

9 – 1

10 – 0

11 – 5

12 – 510

13 – 65

14 – 5

15 – 1

Всего – 86 одношаговых мутаций. Мы видим опять несимметричное распределение аллелей, идущих «на понижение» и «на повышение». Но если это пока отложить на последующее рассмотрение, то 86 мутаций для 587 аллелей – это при равном «возрасте» общего предка соответствует 508 мутациям для 3466 аллелям (в субкладе R1b-L21), а там – только 232 мутации, то есть в 2.19 раз меньше. В идеальном случае (без осложняющих факторов) это соответствует датировке общего предка для выборки J2 примерно 3810x2.19 = 8300 лет. Определение датировки по 417 гаплотипам (другая выборка) гаплогруппы J2 дало 8993±903 и 9914±993 лет до общего предка (по 67– и 111-маркерным гаплотипам). Разница заметная (8 % и 19 %, соответственно), но район датировок тот же, тем более с учетом, что мы сравниваем датировку по одному маркеру с датировками по 67 и 111 маркерам.

Еще одна илюстрация, как примеси сторонних субкладов искажают датировки. В субкладе R1b-L21 3466 аллелей DYS392 распределяются следующим образом:

11 – 8

12 – 22

13 – 2715

14 – 675

15 – 30

16 – 16

Здесь перекос в распределении (по маркеру DYS392=14) вызван тем, что подавляющая часть аллелей «14» относится к нижестоящему субкладу R1b-M222, в котором данная аллель является предковой, и закрепилась в последующих поколениях. В итоге из 821 мутаций 675 относится к отдельному субкладу, со своим общим предком. Для правильного расчета надо инородные аллели снимать, например, путем построения дерева гаплотипов, в котором субклад М222 уйдет в отдельную ветвь, и соответствующие гаплотипы из счета надо также снимать. При этом снятыми окажутся 655 аллелей «14», 24 аллели «15» и все 16 аллелей «16», и распределение окажется вполне симметричным:

11 – 8

12 – 22

13 – 2715

14 – 19

15 – 5

Вопрос 64: Как связаны между собой индивидуальные константы скорости отдельных маркеров, и суммарная (кумулятивная) константа скорости мутации по всему гаплотипу?

Выше мы рассматривали константы скоростей мутаций в отдельных маркерах, как 0.00059 мутаций на условное поколение в маркере DYS393, или 0.00220 мутаций на условное поколение в маркере DYS390. И здесь вступает в силу важное правило химической кинетики: константы скоростей в параллельных реакциях (в данном случае – мутациях) суммируются, если регистрируется расходование исходного вещества или образование суммарного продукта реакции, и изучается скорость этого суммарного процесса. Простой пример – если из бассейна вода вытекает по нескольким трубам разной толщины, то можно изучать скорость вытекания воды по каждой трубе отдельно, но если интересует общая потеря воды, то суммируется потеря воды по всем трубам. Это практически полная аналогия с расходованием предкового гаплотипа и с накоплением гаплотипов потомков. Этот процесс можно изучать по каждому маркеру в отдельности, а можно – по всему гаплотипу, то есть по сумме маркеров.

Рассмотрим простой случай – 12-маркерный гаплотип, состоящий из маркеров DYS 393, 390, 19, 391, 385a, 385b, 426, 388, 439, 389-1, 392, 389-2. Пример – гаплотип гаплогруппы I2a, а именно ее ветви L147.2, к которой относятся почти все восточноевропейские носители этой гаплогруппы, общий предок которых жил примерно 2300 лет назад:

13 24 16 11 14 15 11 13 13 13 11 31

Константы скоростей индивидуальных маркеров следующие:

DYS393 0.00059

DYS390 0.00220

DYS19 0.00179

DYS391 0.00220

DYS385a 0.00280

DYS385a 0.00360

DYS426 0.00009

DYS388 0.00022

DYS439 0.00300

DYS389-1 0.00080

DYS392 0.00040

DYS389-2 0.00231

Но поскольку мутации во всех этих маркерах происходят независимо и неупорядоченно, и мы, как правило, заинтересованы в скорости мутации всего гаплотипа, а не его отдельных маркеров (многочисленные примеры будут даны ниже), то суммарная константа скорости мутаций во всем гаплотипе равна сумме индивидуальных констант скоростей, которая равна 0.0200 мутаций на условное поколение (25 лет).

Так же рассчитываются суммарные константы скорости мутаций в гаплотипах, которые приведены ниже.

Надо сказать, что здесь даются упрощенные примеры, потому что по двум гаплотипам расчеты обычно не ведут, ведут по десяткам, сотням и тысячам гаплотипов, если таковые есть в наличии, рассчитывают математические погрешности в определяемых числах, и т. д. В таких случаях погрешности расчетов приближаются к плюс-минус 10 % от определяемой величины, поскольку именно такой определена погрешность вычисления константы скорости мутации. Здесь только иллюстрируется принцип расчета.

Ясно, что у протяженных 111-маркерных гаплотипов разрешение лучше (400-маркерные гаплотипы пока крайняя редкость). Но их определять дороже, чем более короткие, поэтому в академических исследованиях, при постоянной нехватке денежных средств, приходится работать с более короткими гаплотипами. Протяженные гаплотипы определяют в коммерческих компаниях, обычно персонально, каждый для себя, и передают, как правило, в общественные базы данных. Сейчас в общественных базах данных – сотни тысяч гаплотипов, и базы прирастают многими гаплотипами ежедневно[62].

Вопрос 65: Какие значения имеют все 111 маркеров, применяемые в ДНК-генеалогии?

Таблица приведена ниже. Числа 0.02, 0.046 и 0.09 справа – значения констант скоростей мутаций для 12-, 25-, и 37-маркерных гаплотипов, выраженных в мутациях на гаплотип на условное поколение (в 25 лет). Для 67-маркерных гаплотипов, которые заканчиваются маркером DYS565 константа скорости равна 0.12 мутаций на гаплотип на условное поколение. Самое последнее число, 0.198 – константа скорости мутаций на 111-маркерный гаплотип на условное поколение. Эти величины приведены и обоснованы в статье[63] Клёсова и Килина (2015). Обоснование велось по восьми направлениям:

1) Сопоставление датировок, полученных с помощью линейного метода (ЛМ) по 67– и 111-маркерным гаплотипам. Это – наиболее достоверные форматы гаплотипов.

1 ... 29 30 31 32 33 34 35 36 37 ... 167
На этой странице вы можете бесплатно читать книгу Кому мешает ДНК-генеалогия? - Анатолий Клёсов бесплатно.
Похожие на Кому мешает ДНК-генеалогия? - Анатолий Клёсов книги

Оставить комментарий