Determinar o relacionamento com o primo apenas com base em relacionamentos mútuos com outros primos
fundo
Estou pesquisando genealogia em 23andMe.com, tentando encontrar novos primos e determinar seus relacionamentos comigo. Tudo o que o site me dá é uma lista de pessoas e sua relação de primo prevista comigo (para download como um arquivo CSV), junto com uma página onde posso ver uma lista de parentes comuns entre nós e uma comparação de sua relação prevista com eles (não disponível para download, por exemplo, na página da pessoa X dirá: "pessoa Y-- Você: primo 2 °, X: primo 3 °"). Infelizmente, na minha cultura, historicamente tem havido uma quantidade significativa de endogamia devido à discriminação, então "primo distante" provavelmente pode significar primos 10 ou mais. Para meus propósitos, entendo que significa não relacionado. Isso é o melhor que posso fazer, visto que 23andMe não dá acesso a um conjunto de dados estruturados de todos os parentes comuns com relação a uma determinada pessoa, removendo assim a possibilidade de descartar parentesco com base na falta de um parente estar em outro conjunto de parentes comuns. Portanto, se eu vir no perfil da pessoa Z que eles são primos distantes de vários dos meus primos do lado do meu pai, e eles são primos terceiros da pessoa A de quem eu não tenho certeza, raciocinarei que a pessoa Z está do lado da minha mãe , assim como a pessoa A.
Problema
Raciocinar sobre a informação na forma de "Se você é primo 2 ° com X e distante com Y, Z, A e B, e X é primo 3 ° com C, 4 ° com D e distante com E, então talvez a conexão seja ... "tornou-se extremamente difícil e não produziu uma pequena quantidade de resultados.
Questão
É possível determinar o relacionamento pessoal exato com um primo com base exclusivamente no relacionamento com primos em comum versus o relacionamento deles com primos em comum, e esses primos com outros primos, etc.? Em caso afirmativo, como alguém faria para determinar o relacionamento?
Se isso não ficou claro, aqui está um exemplo para ilustrar a pergunta:
Digamos que eu e o primo de terceiro grau X não sabemos como somos parentes, mas compartilhamos o primo A: X é primo de segundo grau com A, eu sou primo de quarto de A. X também é primo de segundo grau com o primo em comum B e B é primo de segundo grau com o primo de segundo grau C, que eu sei que é meu primo de segundo grau por parte de pai, etc. Passando por esse processo várias vezes e documentando as informações à medida que avança ou Fazendo um gráfico em uma árvore, posso deduzir que, por exemplo, o primo X deve ser o primo paterno da minha avó paterna? Isso é possível? Como eu posso fazer isso?
Progresso até agora
Às vezes, você aprende mais com o que não sabe do que com o que faz, e muitas vezes torna a direção da pesquisa futura mais clara quando você esclarece o que não sabe, então aqui está
O que eu não sei
Depois de uma longa consideração do problema, a conclusão a que cheguei foi que as quatro perguntas a seguir estão no cerne de se a pergunta pode ser respondida e como isso seria feito (talvez eu esteja errado e essas não são o cerne disso) :
- Como faço para determinar se duas pessoas vêm dos mesmos avós?
- Como faço para determinar de que lado cada pessoa descende desses avós? (ou seja, o avô materno de X e a avó materna de Y)?
- Como faço para acompanhar essas relações (especialmente importante se eu fosse escrever um programa para fazer isso)?
- Em geral, o quanto você pode realmente determinar apenas conhecendo o relacionamento de primo com as pessoas? Alguma dessas coisas é possível determinar?
O que eu sei
O que eu determinei até agora:
Dado: A é o enésimo primo de C e B é o enésimo primo de C
- Para dizer com segurança que A, B e C compartilham o mesmo enésimo bisavô: A e B também devem ser enésimos primos um do outro.
Mas raramente isso acontece e, portanto, essa regra não me leva muito longe. Também não é útil porque não explica como determinar de que lado são os avós comuns.
A monotonia da solução não é uma barreira
Mesmo que a resposta à minha pergunta seja um método que envolva muita tentativa e erro, monotonia, etc., desde que seja rigorosamente metódico (em um sentido matemático) de modo que funcione 100% do tempo quando seguido até o fim, posso ensiná-lo a um computador e enviar os resultados para meu programa de geração de gráficos feito à mão chamando algumas linhas de código como este:
graph.addEdge("Grandmother #1" ,"Father #1")
graph.addEdge("Grandmother #1", "Father #2")
graph.addEdge("Grandmother #1", "Childless #3")
graph.addEdge("Father #1", "Jimmy")
graph.addEdge("Father #2", "Sally")
graph.addEdge("Jimmy","Son #1")
graph.addEdge("Jimmy","Son #2")
graph.addEdge("Jimmy","Son #3")
Isso é o que as linhas acima criam:

Às vezes, "trabalhar 100%" significará determinar que algo não pode ser determinado. Isso está ok. Eu gostaria de assumir que, com referências cruzadas suficientes, todo o quadro pode ser descoberto. Eu presumo que este programa seja útil para muitas pessoas, então se eu conseguir ajuda para criá-lo, adoraria distribuí-lo para que outras pessoas possam se beneficiar dele.
PS: Eu escrevi alguns de
Respostas
Parece que a ferramenta What Are The Odds ( WATO ) do DNA Painter pode ajudar. Ajuda você a descobrir como uma pessoa-alvo está relacionada a um conjunto de outras pessoas cujo relacionamento já é conhecido, com base em seu DNA. Você pode ler mais sobre isso aqui .
Também existe uma versão 2 que está atualmente em beta, mas não posso falar sobre os novos recursos que possui.
Embora as árvores WATO tenham sido sugeridas (inclusive por mim) como sua melhor esperança, não acredito que mesmo elas serão adequadas para a tarefa que você propõe. Eu irei mais longe e afirmo que isso não pode ser feito de forma confiável usando apenas dados de correspondência de DNA. Depois de ultrapassar as relações íntimas de pai / filho, irmão e talvez primeiro primo, existem muitos relacionamentos possíveis que compartilham o mesmo intervalo de CM para distingui-los de forma confiável.
Suponha que você construa uma árvore como a do seu exemplo, faça uma comparação entre pares de cada par de amostra (N! / 2 comparações) e procure as probabilidades usando a ferramenta cM compartilhada (e, aliás, se você pode implementar algo que faz isso automaticamente, provavelmente você poderia vendê-lo). À medida que o número de amostras aumenta, a probabilidade de erro na árvore geral aumenta mais rapidamente e, embora seja possível determinar os candidatos para o posicionamento incorreto na árvore, você nunca pode ter certeza de que sua hipótese de maior probabilidade reflete com precisão qualquer remove ou meio-primos (ou primos duplos - se, como você diz, há muita endogamia em sua cultura, então todas as correspondências são suspeitas).
É por isso que a genealogia do DNA nunca foi recomendada como um substituto para a pesquisa tradicional de "trilha de papel", porque não pode ser, pelo menos não em um futuro previsível. Mesmo com navegadores de cromossomos e rastreamento de segmentos em amostras, tudo o que você pode realmente provar é quem tem ancestrais comuns e, possivelmente, até onde.
Eu percebo que minha justificativa pode sofrer com o que meus colegas e eu chamamos de "prova por falta de imaginação" (como em "Não consigo imaginar como isso poderia funcionar"), então se alguém puder apontar uma falha significativa em meu argumento , por favor, faça isso (isso me ajuda tanto quanto qualquer outra pessoa).