Так вот, в ноябре 2014 года попгенетики открыли агрессивную кампанию против ДНК-генеалогии. Но поскольку никаких возражений против самой новой науки они найти не могли, то они обратили свою атаку на меня лично, на факты моей биографии и професссиональной деятельности, и основное внимание было при этом уделено лжи, подтасовкам, передергиваниям. Об этом уже было и будет в этой книге. Статья в Википедии обо мне (которую не я готовил и не я обновлял) подверглась форменному вандализму, выросла за счет лжи, подтасовок и недоразумений во много раз, и то, что написано в вопросе выше – тоже часть этой кампании. Небольшая группа вандалов (а то, что группа небольшая, ясно из обсуждения этой статьи в Википедии, причем наиболее активным вандалом был кандидат филологических наук А. Касьян, отнюдь не обременный знаниями ни в попгенетике, ни тем более в ДНК-генеалогии. Что им двигало в такой активности уродовать статью в Википедии – я понятия не имею. Он же подписал печально известное и лживое «письмо 24-х», о котором шла речь в Предисловии этой книги, и будет идти речь дальше, поэтому его активность в уродовании статьи в Википедии отнюдь не отражало его объективность.
Теперь, после этих объяснений, вернемся к заданному вопросу. Я не знаю, что я там «позиционирую», но ДНК-генеалогия действительно является новой научной дисциплиной. В науке понятие «новой научной дисциплины» определяется ее методологией. Методология ДНК-генеалогии не является методологией ни генетики, ни популяционной генетики. Расчетный аппарат ДНК-генеалогии является полностью отличным от расчетного аппарата генетики или популяционной генетики. Публикации по ДНК-генеалогии совершенно отличаются от публикаций по генетике или популяционной генетике. Википедия даже поместила высказывание О. Балановской, что она не в состоянии понять расчетный аппарат ДНК-генеалогии – цитирую: «они обрабатывают данные непонятными способами». Действительно, какая же ДНК-генеалогия «популяционная генетика», когда математический аппарат другой и непонятный? Вывод – не «позиционирую» я ДНК-генеалогию как новую научную дисциплину, а она таковой и является.
Далее, Википедия утверждает, что
Википедия продолжает –
Наконец, опять Википедия –
1. Реклама тестирующей компании Гентис, 2010 год.
2. Опять реклама Гентис, 2013 год
3. Видеоролик моего выступления на презентации книги.
4. Видеоролик моего выступления «Се – человек».
5. Реклама компании Гентис, зарегистрированной в 2009 году.
6. Описание нашего сайта «Родство», с сообщением, что термин «ДНК-генеалогия» впервые появился на этом сайте в 2006 году.
7. Статья «Введение в ДНК-генеалогию», написанная на основании моих статей и выступлений.
8. Сайт Игоря Гаршина, 2014 год.
9. Выступление М.Н.Задорнова, 2013 год.
10. Реклама моей книги «Происхождение славян».
Ну и далее – выступление члена нашей Академии ДНК-генеалогии; содержание нашего Вестника Академии ДНК-генеалогии; опять реклама книги «Происхождение славян», и так далее, 342 тысячи результатов, как сообщает Google. Кто найдет слова ДНК-генеалогия ранее 2006 года на русском языке – сообщите мне, буду признателен. На английском языке – одна статья с этими словами в названии, см. Вопрос 1. Всё. Никаких
Вопрос 9: Чем популяционная генетика отличается от ДНК-генеалогии?
Практически всем. Адресуемыми вопросами, целями и задачами, методологией, расчетным аппаратом, характером выводов, определениями популяций. Но главное – это вообще другая область науки. Популяционная генетика – описательная по сути, а ДНК-генеалогия – аналитическая. Попгенетика описывает структуру популяций, ДНК-генеалогия описывает историю популяций. Название ведь о многом говорит. Не случайно биологическая химия – это химия, а химическая физика – это физика. Физическая химия – это химия. Биофизика, то есть биологическая физика – это физика. Второе слово в таких составных названиях дисциплин показывает, к какой области науки дисциплина относится. Так вот, популяционная генетика – это генетика. А ДНК-генеалогия к генетике по сути дела никакого отношения не имеет, это – генеалогия, то есть история.
Популяционные генетики с самого начала возникновения термина «ДНК-генеалогия» пытались не допустить возникновения новой науки, потому что прекрасно понимали, что потеряют контроль, монополию на публикации в этой области, и самое главное – что их примитивные и зачастую неверные методы получат огласку. Так, кстати, и получилось. Поэтому они с самого начала возражали против термина ДНК-генеалогия, настаивали, что это то же самое, что популяционная генетика. Это, конечно, не так.
В итоге в российской популяционной генетике сложилась печальная ситуация. Небольшая группа крикливых оппонентов, одни из которых хотят сохранить для себя систему распределения финансовых грантов, то есть продолжать иметь полный доступ к деньгам, другие – их приятели, у третьих есть личные причины, у каждого свои, начинают агрессивно «захлопывать», не гнушаясь никакими средствами. Для этого есть Википедия, есть научные конференции, которые они сами организуют, есть сетевые издания, которые они сами контролируют, есть «дискуссионные сайты», типа «Троицкого варианта», которыми они или управляют, либо вводят ведущих в заблуждение, и кампания разворачивается. Как показывают данные, которые приведены ниже в данной книге, всего десяток человек-оппонентов генерируют на «дискуссионных сайтах» тысячи сообщений, а поскольку это почти исключительно ложь и передергивания, то дискутировать там смысла не имеет. Тактика таких дискуссий давно отработана. Выдвигается очередное ложное положение. Если на него не отвечать, то пишут, что не отвечает, значит, согласен. Если отвечать, раздается хор голосов, что «он оправдывается», значит, неправ. Потоком идут лживые приписки, которые «обвиняемый» никогда не говорил, приводятся якобы «сведения» персонального характера, которые не соответствуют действительности. Отвечать на все это смысла не имеет.
Так вот, о популяционной генетике. Популяционная генетика – это часть генетики, о чем говорит ее название, но со своими особенностями. Главная задача популяционной генетики – это выявление связи между генотипом и фенотипом, то, к чему ДНК-генеалогия не имеет отношения. Популяционная генетика иногда тоже рассматривает гаплогруппы и гаплотипы Y-хромосомы, как и ДНК-генеалогия, но на этом сходство заканчивается. Аппарат популяционной генетики, применяемый для интерпретации получаемых данных, например, «метод главных компонент», характеризуется со стороны ДНК-генеалогии как совершенно примитивный и ведущий к заблуждениям, и не используется в ДНК-генеалогии. Он не отвечает задачам ДНК-генеалогии.
В целом же генетика человека – это наука, изучающая наследственность и изменчивость признаков, определяющих врожденные особенности человека, и передаваемых, как правило, через гены. Но ДНК только на 2 % состоит из генов, а в Y-хромосоме генов вообще ничтожная доля. ДНК-генеалогия в настоящее время изучает в основном Y-хромосому, и не изучает наследственность и изменчивость упомянутых признаков, передаваемых через гены.
Но дело даже не столько в этом. Направления и области науки определяются не объектами исследования, а методологией исследования. Именно методология исследования отличает, например, химию от физики, хотя объекты часто одинаковы. Методология генетики совершенно другая, чем методология ДНК-генеалогии. У них разные задачи исследований. ДНК-генеалогия по сути историческая наука, она оперирует хронологией, датировками древних событий, и для этого ДНК-генеалогия использует свой расчетный аппарат, которого нет в методологии генетики. ДНК-генеалогия использует и развивает методы физико-химической кинетики в применении к ДНК, переводит картину мутаций в хронологические, исторические показатели, как указывалось выше. Это вообще не входит в методологию генетики, у нее другой экспериментальный и аппаратурный базис.
Повторяем, что экспериментальные данные ДНК-гене-алогии – это картина мутаций в нерекомбинантных (то есть не комбинирующихся с другими в ходе передачи наследственной информации потомкам) участках мужской половой хромосомы (на самом деле – и в митохондриальной ДНК, но пока в малой степени, так как информативность мтДНК в ДНК-генеалогии пока несравненно меньше, чем информативность Y-хромосомы). Речь здесь идет об информативности для исторических исследований, которую определяет картина мутаций как в Y-хромосомах отдельных людей, так и их групп, племен, родов, популяций. Естественно, в данном контексте термин «популяций» относится к мужской половине рассматриваемой популяции. В ДНК-генеалогии популяция – это мужская часть населения, на которую распространяются выводы, полученные при рассмотрении определенной выборки. Популяция может или ограничиваться выборкой, или, чаще, быть шире выборки, но при этом подразумевается или доказывается, что выявленные закономерности выборки распространяются на рассматриваемую популяцию. Например, если в пределах популяции сделаны несколько независимых выборок, и результаты в пределах погрешности расчетов совпали, то эти результаты могут распространяться на всю популяцию, пока не найдено обратного.
В ДНК-генеалогии понятие популяции имеет несколько другой смысл, чем в популяционной генетике. Если в ДНК-генеалогии, как пояснено выше, популяция – это мужская часть населения, исторически сложившаяся на определенной территории или в ходе древней миграции, и относящаяся к одному роду, как правило, по мужской линии, то есть воспроизводящая себя в границах рода из поколения в поколение, то в популяционной генетике популяция – это относительно обособленная группа населения, исторически сложившаяся на определенной территории и воспроизводящая себя в этих границах из поколения в поколение. Как видно, между этими двумя определениями популяциями есть два заметных различия. Первое – что в популяционной генетике популяция включает мужчин и женщин, в ДНК-генеалогии – или только мужчин, или только женщин. Причина проста – расчеты в ДНК-генеалогии ведутся или только по мужской линии (Y-хромосома), или только по женской (мтДНК). Второе – в ДНК-генеалогии нет требования обособленности популяции, потому что критерии выборок и расчетов другие. Если на одной территории проживают носители нескольких гаплогрупп, то после идентификации этих гаплогрупп обработка соответствующих данных производится раздельно. В итоге выясняется, как правило, что их древние миграции были различными, что датировки тех миграций были различными, и что, разумеется, общие предки разных гаплогрупп, то есть популяций, были различными.
Итак, методология новой науки – перевод динамической картины мутаций в хронологические показатели, во времена жизни общих предков популяций, а на самом деле – общих предков древних родов и племен. То есть фактически по мутациям в ДНК производится расчет времен, когда в древности жили эти рода и племена, и как эти времена меняются от территории к территории, что может указывать на направления древних миграций[11].
Попгенетики утверждают, что и генетика, и ДНК-генеалогия изучают ДНК, значит – ДНК-генеалогия это генетика. Но это ошибка – полагать, что направление науки определяется объектом исследования. Изучать ДНК– это далеко не обязательно генетика. Например, химик, растворяя ДНК в кислоте и изучая, скажем, вязкость получаемого раствора, вовсе не занимается генетикой. Альберт Сент-Дьорди как-то сказал – «Дайте химику динамомашину, и он тут же растворит ее в соляной кислоте». Это вовсе не означает, что химик при этом будет заниматься электродинамикой.
Это же относится и к искаженным и примитивным методам обработки картин мутаций в ДНК в рамках популяционной генетики. Если популяционный генетик увидит (или получит) набор из сотни гаплотипов, скажем, 37-маркерных, в котором, например, четыре гаплотипа одинаковых, и еще семь будут совпадать друг с другом случайными парами, он сообщит, что в наборе имеется «89 уникальных гаплотипов», и это и будет результатом его исследования, который пойдет в статью в научный журнал. Ни он, ни рецензенты не хотят признать, это эта «информация» не имеет ни малейшей ценности, и фактически никому в таком виде не нужна. Но таковы принципы и правила популяционной генетики. «Молекулярной историей» это назвать никак нельзя. А специалист в ДНК-генеалогии сразу скажет, что общий предок этих ста гаплотипов жил 925±105 лет назад, потому что натуральный логарифм отношения 100/4, поделенный на константу скорости мутации для 37-маркерных гаплотипов (0.09 мутаций на гаплотип на условное поколение в 25 лет) равен 36 → 37 условных поколений, то есть общий предок этой сотни гаплотипов жил примерно 925 лет назад. Сказать это с большей определенностью можно тогда, когда подсчитано число мутаций во всех ста гаплотипах, и если оно будет равно, например, 324 (или близко к тому), тогда 324/100/0.09 = 36 → 37 условных поколений (этот метод расчета называется линейным, в отличие от приведенного выше логарифмического), то есть ровно тот же промежуток времени до общего предка. Погрешность расчетов определяется по известным правилам[12]. Совпадение времен до общего предка для «логарифмического» и «линейного» метода (в первом мутации не считаются, во втором считаются) свидетельствует, что закономерности образования мутаций в гаплотипах следуют кинетике первого порядка, что в свою очередь означает, что все сто гаплотипов действительно произошли от одного прямого общего предка.
Популяционная генетика такими подходами не пользуется, они ей чужды по ряду причин, среди них – приверженность устаревшим, традиционным подходам, отсутствие соответствующего образования, клановость, отсутствие хорошей научной школы. Короче, ДНК-генеалогия является другой дисциплиной, нежели популяционная генетика.
Вопрос 10: Можно ли называть снипы и гаплотипы в Y-хромосоме «генами»? Почему попгенетики постоянно называют их «генофондом»?
Называть снипы и гаплотипы/маркеры в Y-хромосоме «генами» категорически нельзя. Называть совокупность снипов и гаплотипов «генофондом» категорически нельзя. То, что их так называют Балановские – это или вопиющая безграмотность, или совершенно расхлябанный жаргон. Они, Балановские, повсюду используют термин «генофонд», относя его к гаплогруппам, субкладам и гаплотипам. Они не понимают, или не знают, что генофонд – это совокупность генов. Даже Википедия это знает, цитирую –
Балановские же от статьи к статье, от высказывания к высказыванию называют снипы (!) «генофондом». Очередной пример, из десятков и сотен, в недавней статье в сборнике «Археология, этнография и антропология Евразии» (Том 43, № 2, 2015), статья называется (привожу только часть названия) «Структура генофонда по данным маркеров Y-хромосомы». В авторах – Е. Балановская. И дальше, первая фраза Абстракта «Изучен генофонд популяции по SNP-маркерам Y-хромосомы». Категорически неверно. Я уже не говорю, что здесь безграмотность еще и в другом – не пишут в Абстракте «изучено то-то», пишут, что именно обнаружили, нашли, какие выводы сделали. Не пишут в Абстракте «мы собирали грибы», пишут «мы нашли 8 кг грибов», если уж объяснять на пальцах. Но Балановская и эти элементарные вещи не знает, научная школа напрочь отсутствует.
Говоря о ДНК-генеалогии – ни к генетике, ни к генофонду она отношения не имеет. Хотя в определённой части ДНК-генеалогии рассматривают и гены, например, при рассмотрении всего генома человека, но это – специальная часть ДНК-генеалогии, и этого мы здесь касаться не будет. ДНК (дезоксирибонуклеиновая кислота) – это не только гены. Гены вообще занимают только 1,9 % последовательности ДНК. Остальные 98,1 % – длинные участки, так называемые «никчёмные». Генов там нет.[13]
«Никчёмными» эти негенные последовательности ДНК назвали по незнанию, и это название уже уходит в прошлое. По мере исследований, оказалось, что эти последовательности хранят массу информации не только «генеалогического» характера. Более того, оказалось, что они, эти «никчёмные» участки, содержат сотни, если не тысячи крошечных генов РНК, кодирующих так называемые микро-РНК, длиной всего пару десятков нуклеотидов каждый, и которые регулируют синтез белков. Но это – предмет другого повествования.
Эти негенные участки ДНК в мужской Y-хромосоме, одной из 23 хромосом, которые доставляются сперматозоидом в организм будущей матери, копируются от отца к сыну, поколение за поколением. Поскольку у матери такой хромосомы нет, то сын наследует её только от отца. Хромосомы сплетаются с материнской ДНК и образуют новую комбинированную молекулу ДНК, в которой хромосомы отца и матери перетасовываются. Перетасовываются все, кроме мужской Y-хромосомы.
Так и получается, что отец передаёт сыну эту Y-хромосому интактной, строго скопированной со своей. Свою Y-хромосому он получил от своего отца. Тот – от своего. И так далее, на тысячи, десятки тысяч и сотни тысяч лет вглубь, назад, к далёким предкам современных людей и к предкам тех далёких предков.
Если бы Y-хромосома так и передавалась из поколения в поколение действительно неизменной, толку для генеалогии от неё было бы мало. Но неизменного ничего в мире нет, особенно когда речь о копировании. Копирования без ошибок не бывает. В том числе и копирования Y-хромосомы.
Вопрос 11: О каких «экспериментальных точках», или «экспериментальных данных» идет речь при описаниях цели и задач ДНК-генеалогии? Что за «динамическая картина мутаций» в Y-хромосоме? Как это – переводить «картину мутаций» в хронологические показатели?
Результаты ДНК-тестирования мужчин в ДНК-генеалогии сводятся к двум основным показателям. Это – гаплотип и гаплогруппа. Гаплотип – это набор чисел, который является «личным номером ДНК-паспорта» любого мужчины, без исключения. А гаплогруппа, фигурально говоря, это обложка паспорта. Это – не индивидуальная, а групповая характеристика. Гаплогруппа определяет носителя гаплотипа в определенный род, или племя. У любой гаплогруппы, как у любого рода или племени, был один общий предок, патриарх. Поэтому как номер паспорта при наличии обложки является уникальным «определителем» человека, так и гаплотип в совокупности с гаплогруппой являются не менее уникальным определителем человека, при условии, что номер (гаплотип) является достаточно протяженным. Примеры дадим ниже.
Если у мужчины такого номера и паспорта нет, то это не мужчина, а женщина. Именно к такому выводу сейчас нередко приходят археологи, которые именно так наиболее надежно определяют пол скелетного остатка в древнем захоронении. Нет Y-хромосомы, нет мужского гаплотипа и мужской гаплогруппы – значит, женщина. У последних – свой ДНК-паспорт, под названием «митохондриальная ДНК», который они передают своим детям, как девочкам, так и мальчикам. А отец передает исключительно Y-хромосому, и только, разумеется, сыновьям.
Иногда бывают забавные ошибки, которые нередко встречаются в генетике, или в популяционной генетике даже в первичных данных. Так, несколько лет назад изучали геном неандертальца, и обнаружили, что его нуклеотидные последовательности соответствуют гаплогруппе R1b, что для неандертальца более чем невероятно. Потом вообще оказалось, что это самка неандертальца.
В итоге генетики поняли, в чем дело – это было загрязнение образца ДНК от современников, собирающих и обрабатывающих образцы. Вопрос был закрыт.
Итак, у каждого мужчины или мальчика есть Y-хромосома (которой, повторяю, у женщин нет), которая с большой точностью передается к сыну от отца, а тому – от своего отца, а тому – от своего, и так на протяжении сотен, тысяч, десятков и сотен тысяч лет, и все эти тысячелетия, поколение за поколением, Y-хромосома передается почти в неизменном виде. «Почти» – это потому что в мире ничего неизменного – на протяжении тысячелетий – не бывает. В Y-хромосоме тоже происходят постепенные (точнее, микроскачками) изменения, и в среднем на каждое поколение, от каждого отца к каждому сыну, в Y-хромосоме происходит одна мутация, при которой один нуклеотид (это – минимальный блок ДНК, размером примерно в молекулу обычного столового сахара) случайно, неупорядоченно превращается в другой. А в Y-хромосоме таких нуклеотидов 58 миллионов. Так что «почти в неизменном виде» – это одна мутация на 58 миллионов потенциальных вариантов, которые в остальном остаются неизменными. Каждая такая мутация наследуется практически навсегда, потому что при копировании ДНК в следующем поколении биологическая копировальная машина в клеточном ядре «не знает», как оно там было в прошлом поколении. Ее задача – копировать.
Поэтому у каждого мужчины в Y-хромосоме своя картина мутаций. У близких родственников картина мутаций похожа, потому что они, родственники, сравнительно недавно произошли от одного общего предка, и дополнительные мутации в их Y-хромосомах еще не успели образоваться. Если общий предок жил тысячелетия назад, то картина мутаций у потомков разная. Как эту картину отображают?
Отображают картину мутаций в виде так называемых гаплотипов, упомянутых выше как «личный паспорт» каждого мужчины, а именно в виде определенных последовательностей чисел, характерных для каждого человека. Чем эта последовательность длиннее, тем уникальнее гаплотип. Например, у автора этих строк гаплотип Y-хромосомы, состоящий из 111 чисел, записывается в следующем виде:
13 24 16 11 11 15 12 12 10 13 11 17 16 9 10 11 11 24 14 20 34 15 15 16
16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22
22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 31 15 9 15 12 25
27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10 18 15 20 12
24 15 12 15 24 12 23 19 11 15 17 9 11 11
Это – так называемый 111-маркерный гаплотип. Здесь первое число показывает, что в одном из маркеров, или локусов Y-хромосомы определенная последовательность нуклеотидов повторяется 13 раз. В другом маркере, который здесь показан как следующий, блок нуклеотидов повторяется 24 раза, и так далее.
Покажем для сравнения 67-маркерный гаплотип киргиза, из Киргизского Проекта FTDNA (FTDNA – это наиболее известная американская коммерческая компания, которая также ведет значительную исследовательскую работу, и ведет сотни научных и информационных проектов):
13 25 16 11 11 14 12 12 10 13 11 18 15 9 10 11 11 23 14 21 32 12 15
15 16 11 11 19 23 16 16 19 17 33 40 14 11 11 8 17 17 8 11 10 8 12 10
12 21 22 15 10 12 12 13 8 14 22 21 12 12 11 13 11 11 12 12
И еще один гаплотип, другого киргиза из того же Проекта:
13 26 16 11 11 11 12 12 10 14 11 17 15 9 10 11 11 24 14 21 31 12 15
15 16 11 11 19 23 16 16 18 17 33 40 15 11 11 8 17 17 8 11 10 8 12
10 12 21 22 15 10 12 12 13 8 13 22 21 12 12 11 13 11 11 12 12
Выделены мутации между моим гаплотипом и каждым из приведенных киргизских. Их, соответственно, 31 и 33 мутации, а между двумя киргизскими – всего 9 мутаций. Видно, что оба киргиза между собой намного более близкие родственники, чем каждый из них со мной. Уже просматривается основа для определенных выводов, особенно когда изучаются не два гаплотипа, а десятки, сотни, тысячи гаплотипов.
Здесь мутации в ряде маркеров подсчитывались специальным образом, но не будем сейчас на этом останавливаться. Эти различия можно перевести в хронологические показатели, зная среднюю скорость образования мутаций в гаплотипах, и получится, что общий предок автора этих слов и указанных киргизов жил примерно 4500 лет назад, в середине III тыс до н. э., как раз во времена арийских миграций по Русской равнине и Средней Азии, а обоих киргизов – примерно 1010 лет назад, в начале 11-го века нашей эры. Как делается такой расчет, мы покажем ниже.
Вопрос 12: Вы упомянули, что в Y-хромосоме происходит в среднем одна снип-мутация за поколение. Как это определили?
По данным разных исследователей, необратимые снип-мутации в Y-хромосоме, и, видимо, в ДНК в целом, происходят со средней скоростью между 0.5 × 10-9 и 1.0 × 10-9 на нуклеотид в год. В последнее время прошла серия работ независимых исследователей, в которых средняя скорость снип-мутаций определена как 0.78-0.82 × 10-9 на нуклеотид в год. Наконец, исследователи в компании YFull, которые занимаются расчетами скоростей мутаций в Y-хромосоме, принимают в своих расчетах величину скорости 0.8178 × 10-9 на нуклеотид за год[14], хотя такая точность определения совершенно нереальна. Поскольку вся Y-хромосома – примерно 58 миллионов нуклеотидов, и если скорость снип-мутации – 0.8178 × 10-9 на нуклеотид за год, то это составляет 0.8178 × 10-9х58 × 106 = 0.04743 на всю хромосому в год, или 1.185 на всю хромосому за 25 лет. Даже если скорость мутаций не такая точная, а, как свидетельствуют разные публикации, между 0.5 и 1.0 × 10-9, то снип-мутации происходят в среднем между 0.725 и 1.45 мутаций на всю Y-хромосому за 25 лет. То есть как ни считать, мутации в Y-хромосоме происходят со средней скоростью примерно одна мутация за поколение.
Вопрос 13: В последнее время датировки образования гаплогрупп и субкладов определяют по числу снип-мутаций между субкладами или от рассматриваемого субклада до настоящего времени. Сколько при этом принимают число лет на снип? В литературе встречаются величины от 90 до 200 лет на снип. Как такое может быть? Судя по вашим сообщениям, вы весьма критически относитесь к расчетам по снипам, предпочитая расчеты по гаплотипам. Так ли это?
Такое быть не может по разным причинам – или неправильно считают, или считают по разным фрагментам Y-хромосомы. В ответе на предыдущий вопрос было показано, что если брать для расчетов всю Y-хромосому, то одна снип-мутация происходит примерно раз в 25 лет, и эта величина еще зависит от того, какую скорость мутации принять для расчетов. Если скорость мутации будут брать от 0.5Х10-9 до 1.о × 10-9 на нуклеотид за год, то снип-мутация происходит раз в интервал времени между 34 и 17 лет. Мы уже видим, что если скорость мутации не откалибровать надежно, то точность такого метода невелика. Помимо того, точность в реальных условиях еще более низкая, потому что почти никто не секвенирует полную Y-хромосому в поисках снипов, а секвенируют фрагменты, либо небольшие, в 300–500 тысяч нуклеотидов, либо в 10 миллионов нуклеотидов (как в методе BigY), либо, реже, в 30 миллионов нуклеотидов. Но когда пишут, что секвенируют фрагмент в 10 миллионов нуклеотидов, там фрагмент легко может оказаться между 8 и 11 миллионами, и это еще оптимистическое заключение.
Давайте посмотрим, к чему это приведет. Как отмечалось выше, компания YFull принимает величину константы скорости мутации 0.8178Х10-9, в таком случае одна мутация во всей
Y-хромосоме происходит в среднем раз в 1/0.04743 = 21.08 лет. Во фрагменте в 30 миллионов нуклеотидов – раз в 41 год. Во фрагменте в 10 миллионов нуклеотидов – раз в 122 лет. Если фрагменты малые, в 300 тысяч нуклеотидов, то раз в 4075 лет. Вот и выбирайте. YFull собщает, что средний размер фрагмента Y-хромосомы, по которому они ведут расчеты, составляет 8467165 нуклеотидов (такая точность тоже смешна, ну да ладно, это у попгенетиков неисправимо). Тогда одна мутация в таком фрагменте происходит в среднем раз в 144.41 лет (это опять сообщают YFull, опять с такой точностью). Когда умножают на число снипов, к этому прибавляют еще 60 лет. Как объясняют в YFull, 60 лет – это средний возраст клиента, который к ним обращается.
Итак, если читатель не хочет разбираться в деталях, то на этом этапе можно резюмировать, что если исследователи сообщают, что анализируют (в поисках снипов) фрагменты Y-хромосомы в 10 миллионов нуклеотидов, то там на самом деле может быть восемь с половиной миллионов нуклеотидов, и если при этом считать, что скорость снип-мутации составляет именно 0.8178 × 10-9 на нуклеотид в год, то одна снип-мутация происходит раз в 144 года. На деле там, конечно, погрешность более чем солидная.
Но это еще не всё, и погрешность часто еще значительно больше. Дело в том, что снип-мутации происходят не через равные промежутки времени, а неупорядоченно. Если при этом рассматриваются цепочки снипов протяженностью десятки и сотни тысяч лет, то это аналогично рассмотрению ситуации с сотнями бросков монеты, и погрешности из-за неупорядоченности нивелируются. Но для относительно недавних снипов метод расчета очень неточный. Например, если снип образовался 750 лет назад, то в цепочке нисходящих снипов их всего 750/144 = 5 снипов, и погрешность определения времени образования, согласно формулам математической статистики, не меньше ±46 % (с 68 %-ной достоверностью) или ±92 % (с 95%ной достоверностью). В итоге погрешности у большинства датировок по снипам в таблице значительно более высокие, чем у датировок по мутациям в гаплотипах, которые будут рассматриваться ниже.
Есть еще серьезная проблема – в расчетах компании YFull часто игнорируют фактическое количество снипов, и ставят ту датировку, которая им представляется более правильной, «по понятиям». При этом они всегда постулируют, что при разветвлении снипов они образовались точно в одно и то же время, хотя это события совершенно независимые. По аналогии, если у отца двое сыновей, то их возраст далеко не всегда одинаковый, один мог родиться, когда отцу было 18 лет, другой – когда отцу было 70 лет. Такой постулат, «о равенстве возраста сыновей» часто приводит к ситуациям, когда к одному снипу от вышестоящего ведет 5 мутаций (в среднем 720 лет), к другому 20 мутаций (в среднем 2880 лет), а YFull записывает их «возраст» как одинаковый, либо 720, либо 2880 лет, выбор датировки фактически произвольный. В итоге получаются несуразные датировки.
Примеры – в переходе R1a-Y35 > YP7278 зафиксировано 9 промежуточных снипов (это приведено в таблице на сайте YFull), что соответствует 1300 лет разницы, однако датировка для обоих снипов, родительского и нисходящего, приведена как одинаковая, 4300 лет назад. В переходе CTS3402 > CTS2613 зафиксировано 17 промежуточных снипов (2450 лет разницы), однако датировка для обоих снипов в списке YFull – одинаковые 4300 лет назад, вместо 1850 лет назад для нисходящего, как должно быть (и как дает более точная датировка по гаплотипам). И так в таблицах YFull повторяется десятки и сотни раз.
Приходится на этом столь подробно останавливаться, потому что в последнее время усиленно распространяется легенда, что расчеты по снипам – значительно более точные, чем любыми другими методами. Историки могут принять эту легенду за чистую монету, и опять повторится ситуация последних 15 лет, когда практически все расчеты популяционными генетиками, опубликованные в академических журналах, были кардинально искажены, с завышениями до 300–400 %. Для расчетов на времена удаленные, как правило, более 5-10 тысяч лет назад, и тем более на 100–200 тысяч лет назад, когда число снип-мутаций исчисляется многими сотнями, расчеты по снипам действительно могут оказаться полезными, но вводимые постулаты, как равенство датировок для «параллельных» снипов, опять сводит эту пользу к нулю, если не к отрицательным величинам.
Так что да, я весьма критически отношусь к расчетам датировок по снипам, если они не подтверждены перекрестными расчетами с использованием других методов, например, по мутациям в гаплотипах, о чем речь пойдет ниже. Но часто бывает, что другие методы непригодны, или нет соответствующих гаплотипов. Тогда приходится принимать то, что есть. Но часто бывает, что совпадение расчетов по снипам и гаплотипам вполне удовлетворительное. Это придает уверенность, что в принципе подход, основанный на числе снипов, правильный, но он нуждается в доработке.
Здесь надо сказать, что попгенетики опять в своем амплуа – Балановский уже провозгласил, что метод расчетов по снипам самый точный, и ненавистные ему расчетные подходы ДНК-генеалогии можно отставить. Это опять было провозглашено без какого-либо исследования, и единственная статья, в которой Балановский этот метод использовал, дала неверные результаты. Дело в том, что Балановский в своей манере выхватил из многих вариантов лишь одну скорость мутации – 122 года на снип, без малейшего ее обоснования или проверки, и опять получил неверные датировки[15].
Вопрос 14: Что такое гаплотип, и откуда получают те числа, которые показаны при записи гаплотипов?
Эти числа называются «аллели», и показывают, сколько раз определенная (относительно короткая) последовательность нуклеотидов повторяется в Y-хромосоме ДНК человека. Например, такая последовательность: аденин-гуанин-аденин-тимин, или в сокращенном виде АГАТ, или, как чаще записывают, AGAT. Участок Y-хромосомы, в котором имеет место такой повтор, который еще называют «тандемным повтором», четко определен, и носит название DYS393 (DYS означает DNA
В моем гаплотипе, приведенном выше, как и в гаплотипах обоих киргизов, это – первое число, равное 13. Это записывается как DYS393=13, и означает, что у всех нас в данном маркере четверка AGAT повторяется 13 раз. Вот так:
и эти повторы обрамляются уже неупорядоченными последовательностями нуклеотидов в ДНК, как показано выше.
Второе число, аллель в маркере DYS390, у нас троих у всех разное, у меня 24, у одного из упомянутых киргизов 25, у другого – 26. Это – суммарное число повторов других тандемных четверок, а именно TCTG, то есть тимин-цитозин-тимин-гуанин, и ТСТА, тимин-цитозин-тимин-аденин.
В данном случае четверка, TCTG переходит в четверку TCTA, и число повторов складывается.
То есть мы видим, что тандемные повторы состоят не только из разных нуклеотидов в разных комбинациях, и различаются не только числом повторов, но и порой разные повторы комбинируются в одном маркере. Все это создает огромное число вариантов комбинаций, и, как уже было упомянуто, в Y-хромосоме имеется примерно 2500 разных маркеров. Из них в ДНК-генеалогии используется пока не так много, немногим более ста, в редких случаях несколько сотен, как будет показано ниже. Большинство их стандартизованы, то есть записываются в стандартном виде, содержат определенное число аллелей, записанных в определенной последовательности. Ниже я продемонстрирую разные варианты гаплотипов, взяв свой за пример.
Гаплотипы ДНК выбирают так, чтобы в них маркеров было как можно больше (но все-таки чтобы оставаться в рамках практичности), и в ранних работах, примерно до 2005-го года, использовались 6-маркерные гаплотипы, как, например, такой