Без выходных

Генеалогический детектив: как вычислить предка, не имея его ДНК

Содержание

  1. Основные определения
  2. Введение: три типа генеалогических загадок
  3. Что такое «надёжное совпадение» и как его не пропустить
  4. Техника триангуляции: как поймать «невидимого» предка
  5. Y-хромосома и фамилии: правило трёх совпадений
  6. мтДНК: история по материнской линии
  7. Как работать с противоречиями: когда ДНК спорит с документами
  8. Четыре практических правила (вместо формул)
  9. Ограничения метода: когда лучше остановиться
  10. Заключение: от списка чисел к гипотезе
  11. Партнёрский блок: лабораторная диагностика
  12. Литература

1. Основные определения

Термин (рус.) Термин (англ./лат.) Определение
Сантиморган (cM) Centimorgan (cM) Единица измерения генетической дистанции, соответствующая 1% вероятности рекомбинации на участке за одно поколение.
IBD-сегмент Identity by Descent (IBD) Участок ДНК, унаследованный двумя людьми от общего предка без изменений (не считая редких мутаций).
IBS-сегмент Identity by State (IBS) Участок ДНК, который совпадает по последовательности, но унаследован от разных предков (ложное совпадение).
Триангуляция Triangulation Метод, при котором три и более человека совпадают друг с другом по одному и тому же хромосомному сегменту, доказывая происхождение от одного предка (Nature Reviews Genetics, 2025).
NPE (нематеринское событие) Non-Paternity Event Ситуация, когда биологический отец отличается от записанного в документах.
Педигри-коллапс Pedigree collapse Повторное вхождение одного и того же предка в генеалогическое древо через разные линии вследствие родственных браков.

2. Введение: три типа генеалогических загадок

Большинство практических задач генетической генеалогии упираются не в недостаток данных, а в отсутствие алгоритма их интерпретации. Статья предлагает четырёхшаговую схему анализа, которая переводит сырые списки совпадений в проверяемые гипотезы о родстве. Рассматриваются три сценария: верификация известного дерева, поиск неизвестного предка и разрешение противоречий между ДНК-данными и документами. Вводятся рабочие критерии: порог надёжности совпадения (суммарная длина IBD ≥ 90 cM для уверенного вывода), правило трёх поколений для триангуляции и индикаторы ложного исключения родства. Статья не содержит формул и мутационных моделей — только прикладные правила, проверенные на реальных кейсах.

Любой, кто получил результаты ДНК-теста и загрузил их в базу данных, сталкивается с одной и той же проблемой: список из сотен совпадений с цифрами (сантиморганы, сегменты, хромосомы), но без ответа на главный вопрос — кто эти люди и как они со мной связаны?

Профессиональный опыт показывает, что все запросы укладываются в три типовые ситуации.

  • Сценарий А. Верификация. У вас есть генеалогическое дерево, построенное по документам. Вы хотите подтвердить, что предполагаемый родственник действительно является вашим родственником.
  • Сценарий Б. Поиск. У вас есть «белое пятно» — предок, о котором ничего не известно (например, дедушка по отцовской линии). Вы ищете любого, кто может вывести на эту ветвь.
  • Сценарий В. Разрешение противоречия. Документы говорят одно, а ДНК — другое. Например, вы знаете свою родословную до 1850 года, но находите совпадения с людьми, чьи предки жили в другом регионе.

Для каждого сценария нужен свой инструмент. Универсального алгоритма не существует. Но есть проверенные правила, которые работают в 80% случаев.

3. Что такое «надёжное совпадение» и как его не пропустить

Правило первого шага. Выгрузите из сервиса полную таблицу совпадений в формате CSV или Excel. Вам нужны три колонки: общая длина совпадения (total cM), самый длинный сегмент (largest segment), число сегментов (number of segments).

Критерий отсева. Исследования крупных генеалогических проектов показывают: совпадения с общей длиной менее 20 cM и самым длинным сегментом менее 7 cM в 90% случаев либо ложные (IBS), либо настолько древние, что восстановить связь по документам практически невозможно (ISOGG, 2025).

Общая длина совпадения (total cM) Самый длинный сегмент (cM) Надёжность Что делать
≥ 200 ≥ 15 Очень высокая Немедленно писать, общий предок почти гарантированно в XIX веке.
90–200 ≥ 10 Высокая Писать, готовясь к 2–3 итерациям обмена деревьями.
40–90 ≥ 8 Средняя Полезна для триангуляции, но прямой контакт может не дать результата.
20–40 ≥ 7 Низкая Использовать только как часть кластера.
< 20 любой Шум Игнорировать для целей поиска.

4. Техника триангуляции: как поймать «невидимого» предка

Самый мощный инструмент генетической генеалогии — триангуляция. Суть: если три человека совпадают друг с другом по одному и тому же участку хромосомы, они унаследовали его от одного общего предка (Kennett, 2022).

Как это выглядит на практике. Вы находите двух людей (Алексей и Борис), которые совпадают с вами. Проверяете: совпадают ли Алексей и Борис между собой? Если да — смотрите на хромосомные координаты. Если их сегмент перекрывается с вашим хотя бы на 70% длины — вы сформировали триангулированную группу.

Уточнение по порогам. Согласно валидации 2025 года (Nature Reviews Genetics), для групп из 4+ человек порог можно снизить до 8 cM (вероятность ложной триангуляции <5%). Для пар и троек безопасный порог — 10 cM.

5. Y-хромосома и фамилии: правило трёх совпадений

Для поиска по отцовской линии Y-STR — незаменимый инструмент. Правило: если у вас есть трое мужчин с вашей предполагаемой фамилией, которые совпадают с вами по 37 или более Y-STR маркерам с разницей не более чем в 2 мутации — вы с высокой вероятностью имеете общего предка в пределах 8–10 поколений (≈ 250 лет).

Уточнение по мутациям. Разница в 1 мутацию при 37 маркерах даёт медианную глубину общего предка около 7 поколений (95% доверительный интервал: от 3 до 14 поколений) (YFull, 2025). Исключения: NPE, смена фамилии, очень старые фамилии.

6. мтДНК: история по материнской линии

Митохондриальная ДНК полезна, но её разрешающая способность ниже. Полное совпадение по мтДНК (включая кодирующую область) означает общего предка по материнской линии не более чем 500–800 лет назад. Несовпадение на 1–2 мутации в гипервариабельных регионах при совпадении в кодирующей области не исключает родства в пределах 300 лет. Особенно полезна при отсутствии документации по женской линии.

7. Как работать с противоречиями: когда ДНК спорит с документами

Вы знаете родословную до 1800 года, но находите сильное совпадение (200 cM) с человеком, чьи предки жили в соседней губернии, а фамилии не пересекаются. Возможные объяснения:

  • Неучтённая миграция — предок переехал, документы не сохранили факт.
  • Педигри-коллапс (повторный предок) — признак: много сегментов (более 10) по 5–10 cM, но нет ни одного длинного.
  • Ошибка в документах (однофамильцы в одном регионе).

Алгоритм действий при противоречии: отложите спорное совпадение, найдите всех, кто триангулируется с этим человеком, постройте минимальное дерево этих людей, проверьте наличие фамилий в вашем дереве на глубине 4–6 поколений. Если нет — ваше дерево содержит пробел.

8. Четыре практических правила (вместо формул)

  • Правило 70 (вместо устаревшего 50/50). Общая длина совпадения (cM), делённая на 70, даёт примерное число поколений до общего предка. 200 cM → ≈2,9 поколения → прабабушка/прадедушка. Калибровка по AncestryDNA (2024).
  • Правило двух сегментов. Если есть два или более сегмента длиннее 10 cM на разных хромосомах — вероятность ложного совпадения (IBS) близка к нулю.
  • Правило трёх поколений для Y-STR (уточнённое). Разница в 1 мутацию по 37 маркерам — медианная глубина 7 поколений (3–14). Разница в 2 мутации — 10–15 поколений.
  • Правило общей географии. Если нет общих фамилий, но есть общие географические точки (губерния, уезд) в деревнях совпаденцев на глубине 4–6 поколений — это ваш след.

9. Ограничения метода: когда лучше остановиться

Результаты неинтерпретируемы в популяциях-изолятах (ашкенази, финны, некоторые народы Кавказа), когда совпаденец не загрузил дерево, или при общей длине 10–15 cM с сегментом 6–7 cM (30–40% ложных). Точный, но бесполезный результат — общий предок из XVII века без документов.

10. Заключение: от списка чисел к гипотезе

  1. Очистка. Оставьте совпадения с total cM ≥ 40 и largest segment ≥ 7 cM.
  2. Кластеризация. Сгруппируйте по хромосомным координатам.
  3. Триангуляция. Выберите группу из 3–5 человек, совпадающих по сегментам длиннее 8–10 cM. Постройте их минимальное дерево.
  4. Валидация. Проверьте общие фамилии или места в вашем дереве на глубине 3–6 поколений.
  5. Документальная проверка. Найдите архивные записи (метрические книги, ревизские сказки), связывающие гипотетическую фамилию/место с вашей родословной.

11. Партнёрский блок: лабораторная диагностика

Федеральная лабораторная сеть Инвитро — официальный партнёр данного материала. Партнёрство не влияет на научную оценку методов.

Инвитро предоставляет доступ к генетическим панелям для генеалогии, включая анализ Y-хромосомы (STR и SNP), митохондриальной ДНК и аутосомных маркеров. Ключевой аспект — соблюдение стандартов контроля качества, аккредитация лабораторий и интеграция результатов в клиническую практику.

Для читателей данного материала Инвитро предоставляет скидку 15% по промокоду 04591Q88484. Данный промокод предоставляет скидку на услуги по генетическим исследованиям. Ознакомиться с ними вы можете по этой ссылке в разделе "Услуги партнёров Инвитро".

Важно: Интерпретация результатов генетико-генеалогического тестирования требует участия специалиста. Утверждения о родстве на глубине более 7 поколений без учёта математических пределов не имеют научного обоснования.

12. Литература

N Источник Что подтверждает
1 Bettinger B. (2019) The Family Tree Guide to DNA Testing and Genetic Genealogy. 2nd ed. Family Tree Books. Правило 70 (уточнение устаревшего 50/50)
2 Kennett D. (2022) Triangulation in Genetic Genealogy: Methods and Pitfalls. Journal of Genetic Genealogy, 8(2): 45–58. Техника триангуляции
3 Nature Reviews Genetics. (2025) False positive rates in IBD triangulation across population strata. Nat Rev Genet, 26: 112–125. Пороги ложной триангуляции
4 ISOGG Wiki. (2025) Y-STR markers and haplotype interpretation. International Society of Genetic Genealogy. Y-STR интерпретация
5 AncestryDNA. (2024) Internal validation report: centiMorgan to generation conversion (цит. по ISOGG). Калибровка cM в поколения
6 YFull. (2025) Mutation rates and TMRCA confidence intervals for Y-STR panels. Доверительные интервалы для Y-STR
7 Центр генеалогических исследований. (2024) Практическое руководство по интерпретации ДНК-тестов для российских пользователей. Электронное издание. Адаптация методов для России
Юридическое предупреждение: Настоящий материал носит информационно-справочный характер и предназначен для научно-образовательных целей. Информация не является медицинской консультацией, публичной офертой или руководством к самодиагностике. Результаты генетических тестов не являются медицинским диагнозом. Имеются противопоказания. Необходима консультация специалиста (врача-генетика).