Определение отношения к кузену исключительно на основании взаимоотношений с другими кузенами

Aug 17 2020

Задний план

Я изучаю генеалогию на 23andMe.com, пытаюсь найти новых кузенов и определить их отношения со мной. Все, что дает мне сайт, - это список людей и их предполагаемые двоюродные отношения со мной (можно загрузить в виде файла CSV), а также страницу, на которой я могу просмотреть список общих родственников между нами и сравнение их предполагаемых отношений с ними. (не загружается, например, на странице пользователя X будет написано: «Человек Y-- Вы: 2-й кузен, X: 3-й кузен»). К сожалению, в моей культуре исторически существовало значительное количество эндогамии из-за дискриминации, поэтому «дальний кузен», вероятно, может означать 10+ кузенов или больше. Для моих целей я понимаю, что это не связано. Это лучшее, что я могу сделать, учитывая, что 23andMe не предоставляет доступ к структурированному набору данных всех общих родственников по отношению к данному человеку, тем самым устраняя возможность исключения родства на основе отсутствия родственника в группе другого родственника. набор общих родственников. Следовательно, если я увижу в профиле человека Z, что они дальние родственники нескольким моим кузенам по отцовской линии и третьи кузены человеку А, в котором я не уверен, я буду считать, что этот человек Z на стороне моей матери. , как и человек А.

Проблема

Рассуждение об информации в форме: «Если вы двоюродные братья с X и далеки от Y, Z, A и B, а X - третьи кузены с C, 4-е с D и далекие от E, то, возможно, связь ... "стало чрезвычайно трудным и не дало никаких результатов.

Вопрос

Можно ли определить точные личные отношения с двоюродным братом исключительно на основе ваших отношений с общими кузенами по сравнению с их отношениями к общим кузенам, а эти двоюродные братья с другими кузенами и т. Д.? Если да, то как определить отношения?

Если это было неясно, вот пример, иллюстрирующий вопрос:

допустим, я и 3-й кузен X не знаю, как мы связаны, но у нас общий кузен A: X 2-кузен с A, я 4-кузен с A. X также является троюродным братом с общим кузеном B, а B - вторым кузеном с (общим) кузеном C, который, как я знаю, является моим вторым кузеном со стороны моего отца и т. Д. Пройдя этот процесс достаточно раз и документируя информацию по ходу или Изобразив его на дереве, могу ли я сделать вывод, что, например, двоюродный брат X должен быть двоюродным братом моей бабушки по отцовской линии? Это возможно? Как я могу это сделать?

Прогресс на данный момент

Иногда вы узнаете больше из того, чего не знаете, чем из того, что делаете, и часто это проясняет направление будущих исследований, когда вы четко понимаете то, чего не знаете, так что вот

Что я не знаю

После долгого рассмотрения проблемы я пришел к выводу, что следующие четыре вопроса лежат в основе того, можно ли ответить на этот вопрос и как это будет сделано (возможно, я ошибаюсь, и это не в основе) :

Как определить, происходят ли два человека от одних и тех же бабушек и дедушек?
Как мне определить, с какой стороны каждый человек происходит от этих бабушек и дедушек? (т.е. дедушка X по материнской линии и бабушка Y по материнской линии)?
Как мне отслеживать эти отношения (особенно важно, если я должен был написать программу для этого)?
В общем, сколько вы действительно можете определить, просто зная о двоюродных отношениях с людьми? Можно ли определить что-нибудь из этого?

Что я знаю

Что я определил до сих пор:

Дано: A - n-кузен C, а B - n-кузен C

Чтобы с уверенностью сказать, что у A, B и C одни и те же n-прабабушка: A и B также должны быть n-м кузенами друг другу.

Но такое случается редко, и поэтому это правило не уводит меня далеко. Кроме того, он пока бесполезен, потому что не объясняет, как определить, с какой стороны общие бабушка и дедушка.

Однообразие решения не помеха

Даже если ответ на мой вопрос - это метод, который включает в себя множество проб и ошибок, однообразие и т. Д., При условии, что он строго методичен (в математическом смысле), так что при следовании ему будет работать 100% времени. До самого конца я могу обучить этому компьютер и отправить эти результаты в мою программу для создания графов, сделанную вручную, вызвав несколько строк кода, например:

    graph.addEdge("Grandmother #1" ,"Father #1")
    graph.addEdge("Grandmother #1", "Father #2")
    graph.addEdge("Grandmother #1", "Childless #3")
    graph.addEdge("Father #1", "Jimmy")
    graph.addEdge("Father #2", "Sally")
    graph.addEdge("Jimmy","Son #1")
    graph.addEdge("Jimmy","Son #2")
    graph.addEdge("Jimmy","Son #3")

Вот что создают приведенные выше строки:

Иногда «работа на 100%» означает определение, что что-то не может быть определено. Это хорошо. Я хотел бы предположить, что при достаточном количестве перекрестных ссылок можно понять всю картину. Я предполагаю, что эта программа будет полезна многим людям, поэтому, если мне помогут в ее создании, я бы с удовольствием распространял ее, чтобы другие могли извлечь из нее пользу.
PS: Я написал некоторые из

Ответы

1 PeterKühne Aug 18 2020 at 08:59

Похоже, вам может помочь инструмент DNA Painter What Are The Odds ( WATO ). Это помогает вам выяснить, как целевой человек связан с набором других людей, отношения которых уже известны, на основе их ДНК. Вы можете прочитать об этом здесь .

Существует также версия 2, которая в настоящее время находится в стадии бета-тестирования, но я не могу говорить о ее новых функциях.

1 cleaverkin Aug 18 2020 at 18:35

Хотя деревья WATO были предложены (в том числе мной) как ваша лучшая надежда, я не верю, что даже они будут адекватными для задачи, которую вы предлагаете. Я захожу так далеко, что утверждаю, что этого нельзя сделать надежно, используя только данные совпадения ДНК. Как только вы выйдете за пределы близких отношений родитель / ребенок, родного брата и, возможно, двоюродного брата, появляется слишком много возможных отношений, которые имеют один и тот же диапазон cM, чтобы надежно различать их.

Предположим, вы должны построить дерево, подобное тому, что в вашем примере, затем выполнить попарное сравнение каждой пары образцов (N! / 2 сравнений) и найти вероятности с помощью инструмента Shared cM (и, кстати, если вы можете что-то реализовать который делает это автоматически, вы, вероятно, сможете продать его). По мере увеличения числа выборок вероятность ошибки в общем дереве возрастает быстрее, и хотя можно определить кандидатов для неправильного размещения в дереве, вы никогда не можете быть уверены, что ваша гипотеза с наибольшей вероятностью точно отражает любую удаляет или сводных кузенов (или двойных кузенов - если, как вы говорите, в вашей культуре много эндогамии, то все совпадения являются подозрительными).

Вот почему ДНК-генеалогия никогда не рекомендовалась в качестве замены традиционным исследованиям «бумажного следа», потому что этого не может быть, по крайней мере, в обозримом будущем. Даже с помощью браузеров хромосом и отслеживания сегментов в выборках все, что вы действительно можете доказать, - это у кого общие предки и, возможно, как давно.

Я понимаю, что мое оправдание может пострадать из-за того, что мы с коллегами называем «доказательством отсутствия воображения» (например, «я не могу представить, как это могло бы работать»), поэтому, если кто-нибудь может указать на существенный недостаток в моем аргументе , сделайте это (мне это помогает не меньше, чем кому-либо другому).