Determinazione della relazione con il cugino basata esclusivamente su relazioni reciproche con altri cugini

Aug 17 2020

sfondo

Sto facendo ricerche genealogiche su 23andMe.com, cercando di trovare nuovi cugini e determinare le loro relazioni con me. Tutto ciò che il sito mi dà è un elenco di persone e la loro relazione cugina predetta con me (scaricabile come file CSV), insieme a una pagina in cui posso visualizzare un elenco di parenti comuni tra noi e un confronto della loro relazione prevista con loro (non scaricabile, ad esempio sulla pagina della persona X dirà, "persona Y-- Tu: 2 ° cugino, X: 3 ° cugino"). Sfortunatamente, nella mia cultura, c'è stata storicamente una quantità significativa di endogamia a causa della discriminazione, quindi "Cugino lontano" può probabilmente significare 10 ° cugino o più. Per i miei scopi, lo considero non correlato. Questo è il meglio che posso fare, dato che 23andMe non dà accesso a un set di dati strutturato di tutti i parenti comuni rispetto a una data persona, rimuovendo così la possibilità di escludere la parentela basata sulla mancanza di un parente in quello di un altro parente. set di parenti comuni. Quindi, se vedo sul profilo della persona Z che sono cugini lontani di molti dei miei cugini da parte di mio padre, e sono cugini di terzo grado della persona A di cui non sono sicuro, penserò che quella persona Z sia dalla parte di mia madre , così come la persona A.

Problema

Ragionare sulle informazioni sotto forma di "Se sei 2 ° cugino con X e distante con Y, Z, A e B, e X è 3 ° cugino con C, 4 ° con D e distante con E, allora forse la connessione è ... "è diventato estremamente difficile e non ha prodotto un briciolo di risultati.

Domanda

È possibile determinare l'esatta relazione da persona a persona con un cugino esclusivamente in base alla tua relazione con cugini reciproci rispetto alla loro relazione con cugini reciproci e quei cugini con altri cugini, ecc.? In tal caso, come si fa a determinare la relazione?

Se ciò non fosse chiaro, ecco un esempio per illustrare la domanda:

diciamo che io e il terzo cugino X non sappiamo come siamo imparentati, ma condividiamo il cugino A: X è il secondo cugino con A, io sono il quarto cugino con A. X è anche terzo cugino con cugino condiviso B, e B è secondo cugino con cugino (condiviso) C che so essere mio secondo cugino da parte di mio padre, ecc. Eseguendo questo processo abbastanza volte e documentando le informazioni mentre vado o rappresentandolo graficamente su un albero, posso dedurre che, ad esempio, il cugino X deve essere il cugino paterno di mia nonna paterna? È possibile? Come posso fare ciò?

Finora

A volte si impara di più da ciò che non si sa che da ciò che si fa, e spesso rende più chiara la direzione della ricerca futura quando si chiarisce ciò che non si sa, quindi ecco

Quello che non so

Dopo una lunga considerazione del problema, la conclusione a cui sono giunto è stata che le seguenti quattro domande sono al centro della questione se è possibile rispondere alla domanda e come sarebbe stato fatto (forse mi sbaglio e queste non sono al centro) :

Come faccio a determinare se due persone provengono dagli stessi nonni?
Come faccio a determinare da che parte discende ogni persona da quei nonni? (cioè il nonno materno di X e la nonna materna di Y)?
Come tengo traccia di queste relazioni (particolarmente importante se dovessi scrivere un programma per farlo)?
In generale, quanto puoi davvero determinare conoscendo il rapporto tra cugino e le persone? È possibile determinare qualcuna di queste cose?

Quello che so

Quello che ho determinato finora:

Dato: A è l'ennesimo cugino di C e B è l'ennesimo cugino di C

Per dire con sicurezza che A, B e C condividono gli stessi ennesimi bisnonni: A e B devono anche essere ennesimi cugini tra loro.

Ma raramente ciò accade e, quindi, questa regola non mi porta molto lontano. Inoltre, non è ancora utile perché non spiega come determinare da quale parte provengono i nonni comuni.

La monotonia della soluzione non è una barriera

Anche se la risposta alla mia domanda è un metodo che implica molte prove ed errori, monotonia, ecc., Purché sia rigorosamente metodico (in senso matematico) tale da funzionare il 100% delle volte se seguito fino alla fine, posso insegnarlo a un computer e inviare quei risultati al mio programma di generazione di grafici fatto a mano chiamando alcune righe di codice come questa:

    graph.addEdge("Grandmother #1" ,"Father #1")
    graph.addEdge("Grandmother #1", "Father #2")
    graph.addEdge("Grandmother #1", "Childless #3")
    graph.addEdge("Father #1", "Jimmy")
    graph.addEdge("Father #2", "Sally")
    graph.addEdge("Jimmy","Son #1")
    graph.addEdge("Jimmy","Son #2")
    graph.addEdge("Jimmy","Son #3")

Questo è ciò che creano le righe precedenti:

A volte "lavorare al 100%" significherà determinare che qualcosa non può essere determinato. Va bene. Vorrei supporre però che con un numero sufficiente di riferimenti incrociati, l'intera immagine può essere capita. Presumo che questo programma sarebbe utile a molte persone, quindi se ricevo aiuto per crearlo mi piacerebbe distribuirlo in modo che altri possano trarne vantaggio.
PS: ne ho scritti alcuni

Risposte

1 PeterKühne Aug 18 2020 at 08:59

Sembra che lo strumento What Are The Odds ( WATO ) di DNA Painter possa essere di aiuto. Ti aiuta a capire in che modo una persona target è correlata a un insieme di altre persone la cui relazione è già nota, in base al loro DNA. Puoi leggere di più al riguardo qui .

C'è anche una versione 2 che è attualmente in beta, ma non posso parlare delle nuove funzionalità che ha.

1 cleaverkin Aug 18 2020 at 18:35

Sebbene gli alberi WATO siano stati suggeriti (anche da me) come la tua migliore speranza, non credo che anche loro saranno adeguati al compito che proponi. Arriverò al punto di affermare che non può essere fatto in modo affidabile utilizzando solo dati di corrispondenza del DNA. Una volta superate le strette relazioni di genitore / figlio, fratello e forse primo cugino, ci sono troppe possibili relazioni che condividono lo stesso intervallo di CM per distinguerle in modo affidabile.

Supponi di dover costruire un albero come quello nel tuo esempio, quindi fai un confronto a coppie di ogni coppia campione (N! / 2 confronti) e cerca le probabilità usando lo strumento cM condiviso (e, btw, se puoi implementare qualcosa che lo fa automaticamente, probabilmente potresti venderlo). Man mano che il numero di campioni aumenta, la probabilità di errore nell'intero albero aumenta più velocemente e, sebbene possa essere possibile determinare i candidati per un posizionamento errato nell'albero, non puoi mai essere certo che la tua ipotesi di probabilità più alta rifletta accuratamente qualsiasi rimuove o mezzi cugini (o doppi cugini - se, come dici tu, c'è molta endogamia nella tua cultura, allora tutte le corrispondenze sono sospette).

Questo è il motivo per cui la genealogia del DNA non è mai stata raccomandata come sostituto della tradizionale ricerca "paper trail", perché non può esserlo, almeno non nel prossimo futuro. Anche con i browser dei cromosomi e il tracciamento dei segmenti attraverso i campioni, tutto ciò che puoi veramente dimostrare è chi ha antenati comuni e possibilmente quanto tempo fa.

Mi rendo conto che la mia giustificazione potrebbe risentire di ciò che i miei colleghi e io chiamiamo "prova per mancanza di immaginazione" (come in "Non riesco a immaginare come potrebbe funzionare"), quindi se qualcuno può sottolineare un difetto significativo nella mia argomentazione , per favore fallo (mi aiuta tanto quanto chiunque altro).