Determinar o relacionamento com o primo apenas com base em relacionamentos mútuos com outros primos

Aug 17 2020

fundo

Estou pesquisando genealogia em 23andMe.com, tentando encontrar novos primos e determinar seus relacionamentos comigo. Tudo o que o site me dá é uma lista de pessoas e sua relação de primo prevista comigo (para download como um arquivo CSV), junto com uma página onde posso ver uma lista de parentes comuns entre nós e uma comparação de sua relação prevista com eles (não disponível para download, por exemplo, na página da pessoa X dirá: "pessoa Y-- Você: primo 2 °, X: primo 3 °"). Infelizmente, na minha cultura, historicamente tem havido uma quantidade significativa de endogamia devido à discriminação, então "primo distante" provavelmente pode significar primos 10 ou mais. Para meus propósitos, entendo que significa não relacionado. Isso é o melhor que posso fazer, visto que 23andMe não dá acesso a um conjunto de dados estruturados de todos os parentes comuns com relação a uma determinada pessoa, removendo assim a possibilidade de descartar parentesco com base na falta de um parente estar em outro conjunto de parentes comuns. Portanto, se eu vir no perfil da pessoa Z que eles são primos distantes de vários dos meus primos do lado do meu pai, e eles são primos terceiros da pessoa A de quem eu não tenho certeza, raciocinarei que a pessoa Z está do lado da minha mãe , assim como a pessoa A.

Problema

Raciocinar sobre a informação na forma de "Se você é primo 2 ° com X e distante com Y, Z, A e B, e X é primo 3 ° com C, 4 ° com D e distante com E, então talvez a conexão seja ... "tornou-se extremamente difícil e não produziu uma pequena quantidade de resultados.

Questão

É possível determinar o relacionamento pessoal exato com um primo com base exclusivamente no relacionamento com primos em comum versus o relacionamento deles com primos em comum, e esses primos com outros primos, etc.? Em caso afirmativo, como alguém faria para determinar o relacionamento?

Se isso não ficou claro, aqui está um exemplo para ilustrar a pergunta:

Digamos que eu e o primo de terceiro grau X não sabemos como somos parentes, mas compartilhamos o primo A: X é primo de segundo grau com A, eu sou primo de quarto de A. X também é primo de segundo grau com o primo em comum B e B é primo de segundo grau com o primo de segundo grau C, que eu sei que é meu primo de segundo grau por parte de pai, etc. Passando por esse processo várias vezes e documentando as informações à medida que avança ou Fazendo um gráfico em uma árvore, posso deduzir que, por exemplo, o primo X deve ser o primo paterno da minha avó paterna? Isso é possível? Como eu posso fazer isso?

Progresso até agora

Às vezes, você aprende mais com o que não sabe do que com o que faz, e muitas vezes torna a direção da pesquisa futura mais clara quando você esclarece o que não sabe, então aqui está

O que eu não sei

Depois de uma longa consideração do problema, a conclusão a que cheguei foi que as quatro perguntas a seguir estão no cerne de se a pergunta pode ser respondida e como isso seria feito (talvez eu esteja errado e essas não são o cerne disso) :

  1. Como faço para determinar se duas pessoas vêm dos mesmos avós?
  2. Como faço para determinar de que lado cada pessoa descende desses avós? (ou seja, o avô materno de X e a avó materna de Y)?
  3. Como faço para acompanhar essas relações (especialmente importante se eu fosse escrever um programa para fazer isso)?
  4. Em geral, o quanto você pode realmente determinar apenas conhecendo o relacionamento de primo com as pessoas? Alguma dessas coisas é possível determinar?

O que eu sei

O que eu determinei até agora:

Dado: A é o enésimo primo de C e B é o enésimo primo de C

  • Para dizer com segurança que A, B e C compartilham o mesmo enésimo bisavô: A e B também devem ser enésimos primos um do outro.

Mas raramente isso acontece e, portanto, essa regra não me leva muito longe. Também não é útil porque não explica como determinar de que lado são os avós comuns.

A monotonia da solução não é uma barreira

Mesmo que a resposta à minha pergunta seja um método que envolva muita tentativa e erro, monotonia, etc., desde que seja rigorosamente metódico (em um sentido matemático) de modo que funcione 100% do tempo quando seguido até o fim, posso ensiná-lo a um computador e enviar os resultados para meu programa de geração de gráficos feito à mão chamando algumas linhas de código como este:

    graph.addEdge("Grandmother #1" ,"Father #1")
    graph.addEdge("Grandmother #1", "Father #2")
    graph.addEdge("Grandmother #1", "Childless #3")
    graph.addEdge("Father #1", "Jimmy")
    graph.addEdge("Father #2", "Sally")
    graph.addEdge("Jimmy","Son #1")
    graph.addEdge("Jimmy","Son #2")
    graph.addEdge("Jimmy","Son #3")

Isso é o que as linhas acima criam:


Às vezes, "trabalhar 100%" significará determinar que algo não pode ser determinado. Isso está ok. Eu gostaria de assumir que, com referências cruzadas suficientes, todo o quadro pode ser descoberto. Eu presumo que este programa seja útil para muitas pessoas, então se eu conseguir ajuda para criá-lo, adoraria distribuí-lo para que outras pessoas possam se beneficiar dele.
PS: Eu escrevi alguns de

Respostas

1 PeterKühne Aug 18 2020 at 08:59

Parece que a ferramenta What Are The Odds ( WATO ) do DNA Painter pode ajudar. Ajuda você a descobrir como uma pessoa-alvo está relacionada a um conjunto de outras pessoas cujo relacionamento já é conhecido, com base em seu DNA. Você pode ler mais sobre isso aqui .

Também existe uma versão 2 que está atualmente em beta, mas não posso falar sobre os novos recursos que possui.

1 cleaverkin Aug 18 2020 at 18:35

Embora as árvores WATO tenham sido sugeridas (inclusive por mim) como sua melhor esperança, não acredito que mesmo elas serão adequadas para a tarefa que você propõe. Eu irei mais longe e afirmo que isso não pode ser feito de forma confiável usando apenas dados de correspondência de DNA. Depois de ultrapassar as relações íntimas de pai / filho, irmão e talvez primeiro primo, existem muitos relacionamentos possíveis que compartilham o mesmo intervalo de CM para distingui-los de forma confiável.

Suponha que você construa uma árvore como a do seu exemplo, faça uma comparação entre pares de cada par de amostra (N! / 2 comparações) e procure as probabilidades usando a ferramenta cM compartilhada (e, aliás, se você pode implementar algo que faz isso automaticamente, provavelmente você poderia vendê-lo). À medida que o número de amostras aumenta, a probabilidade de erro na árvore geral aumenta mais rapidamente e, embora seja possível determinar os candidatos para o posicionamento incorreto na árvore, você nunca pode ter certeza de que sua hipótese de maior probabilidade reflete com precisão qualquer remove ou meio-primos (ou primos duplos - se, como você diz, há muita endogamia em sua cultura, então todas as correspondências são suspeitas).

É por isso que a genealogia do DNA nunca foi recomendada como um substituto para a pesquisa tradicional de "trilha de papel", porque não pode ser, pelo menos não em um futuro previsível. Mesmo com navegadores de cromossomos e rastreamento de segmentos em amostras, tudo o que você pode realmente provar é quem tem ancestrais comuns e, possivelmente, até onde.

Eu percebo que minha justificativa pode sofrer com o que meus colegas e eu chamamos de "prova por falta de imaginação" (como em "Não consigo imaginar como isso poderia funcionar"), então se alguém puder apontar uma falha significativa em meu argumento , por favor, faça isso (isso me ajuda tanto quanto qualquer outra pessoa).