Determinar la relación con el primo basándose únicamente en las relaciones mutuas con otros primos

Aug 17 2020

Antecedentes

Estoy investigando genealogía en 23andMe.com, tratando de encontrar nuevos primos y determinar sus relaciones conmigo. Todo lo que me da el sitio es una lista de personas y su relación de primos prevista conmigo (descargable como un archivo CSV), junto con una página donde puedo ver una lista de parientes comunes entre nosotros y una comparación de su relación prevista con ellos. (no descargable, por ejemplo, en la página de la persona X dirá, "persona Y-- Tú: primo segundo, X: primo tercero"). Desafortunadamente, en mi cultura, históricamente ha habido una cantidad significativa de endogamia debido a la discriminación, por lo que "primo lejano" probablemente puede significar primos décimo o más. Para mis propósitos, lo entiendo como no relacionado. Esto es lo mejor que puedo hacer, dado que 23andMe no da acceso a un conjunto de datos estructurados de todos los parientes comunes con respecto a una persona determinada, eliminando así la posibilidad de descartar parentesco basado en la falta de un pariente en la casa de otro pariente. parientes comunes establecidos. Por lo tanto, si veo en el perfil de la persona Z que son primos lejanos de varios de mis primos por parte de mi padre, y son primos terceros de la persona A de la que no estoy seguro, razonaré que la persona Z está del lado de mi madre. , al igual que la persona A.

Problema

Razonamiento sobre la información en forma de "Si eres primo segundo con X y distante con Y, Z, A y B, y X es primo tercero con C, cuarto con D y distante con E, entonces tal vez la conexión sea ... "se ha vuelto extremadamente difícil y no ha producido ni una pizca de resultados.

Pregunta

¿Es posible determinar la relación exacta de persona a persona con un primo basándose únicamente en su relación con los primos mutuos frente a su relación con los primos mutuos y esos primos con otros primos, etc.? Si es así, ¿cómo se haría para determinar la relación?

Si eso no quedó claro, aquí hay un ejemplo para ilustrar la pregunta:

Digamos que yo y el primo tercero X no sabemos cómo estamos relacionados, pero compartimos el primo A: X es primo segundo con A, yo soy primo cuarto con A. X también es primo tercero con el primo compartido B, y B es primo segundo con el primo (compartido) C, que sé que es mi primo segundo por parte de mi padre, etc. Pasando por este proceso suficientes veces y documentando la información a medida que avanzo o graficándolo en un árbol, ¿puedo deducir que, por ejemplo, el primo X debe ser el primo paterno de mi abuela paterna? ¿Es eso posible? ¿Cómo puedo hacer eso?

Progreso hasta ahora

A veces aprendes más de lo que no sabes que de lo que haces y, a menudo, aclara la dirección de la investigación futura cuando tienes claro lo que no sabes, así que aquí tienes

Lo que no se

Después de una larga consideración del problema, la conclusión a la que llegué fue que las siguientes cuatro preguntas están en el centro de si la pregunta puede responderse y cómo se haría (tal vez estoy equivocado y estas no son el centro de la misma) :

  1. ¿Cómo puedo determinar si dos personas provienen de los mismos abuelos?
  2. ¿Cómo determino de qué lado desciende cada persona de esos abuelos? (es decir, el abuelo materno de X y la abuela materna de Y)?
  3. ¿Cómo hago un seguimiento de esas relaciones (especialmente importante si tuviera que escribir un programa para hacerlo)?
  4. En general, ¿cuánto se puede determinar realmente con solo conocer la relación entre primos y personas? ¿Es posible determinar alguna de estas cosas?

Lo que yo se

Lo que he determinado hasta ahora:

Dado: A es enésimo primo de C y B es enésimo primo de C

  • Para decir con seguridad que A, B y C comparten los mismos tatarabuelos enésimo: A y B también deben ser primos enésimo entre sí.

Pero rara vez sucede eso y, por lo tanto, esta regla no me lleva muy lejos. Tampoco es útil todavía porque no explica cómo determinar de qué lado son los abuelos comunes.

La monotonía de la solución no es una barrera

Incluso si la respuesta a mi pregunta es un método que implica mucho ensayo y error, monotonía, etc., siempre que sea rigurosamente metódico (en un sentido matemático) tal que funcione el 100% del tiempo cuando se siga hasta el final, puedo enseñarlo a una computadora y enviar esos resultados a mi programa de generación de gráficos hecho a mano llamando a algunas líneas de código como este:

    graph.addEdge("Grandmother #1" ,"Father #1")
    graph.addEdge("Grandmother #1", "Father #2")
    graph.addEdge("Grandmother #1", "Childless #3")
    graph.addEdge("Father #1", "Jimmy")
    graph.addEdge("Father #2", "Sally")
    graph.addEdge("Jimmy","Son #1")
    graph.addEdge("Jimmy","Son #2")
    graph.addEdge("Jimmy","Son #3")

Esto es lo que crean las líneas anteriores:


A veces, "trabajar al 100%" significará determinar que algo no se puede determinar. Está bien. Sin embargo, me gustaría asumir que con suficientes referencias cruzadas, se puede descifrar la imagen completa. Asumiría que este programa sería útil para muchas personas, así que si recibo ayuda para crearlo, me encantaría distribuirlo para que otros puedan beneficiarse de él.
PD: escribí algunos de

Respuestas

1 PeterKühne Aug 18 2020 at 08:59

Parece que la herramienta What Are The Odds ( WATO ) de DNA Painter podría ser de ayuda. Le ayuda a descubrir cómo se relaciona una persona objetivo con un conjunto de otras personas cuya relación ya se conoce, según su ADN. Puedes leer más sobre esto aquí .

También hay una versión 2 que está actualmente en beta, pero no puedo hablar de las nuevas funciones que tiene.

1 cleaverkin Aug 18 2020 at 18:35

Aunque los árboles WATO han sido sugeridos (incluso por mí) como su mejor esperanza, no creo que ni siquiera ellos sean adecuados para la tarea que propone. Iré tan lejos como para afirmar que no se puede hacer de manera confiable utilizando solo datos de coincidencia de ADN. Una vez que va más allá de las relaciones cercanas de padre / hijo, hermano y tal vez primo hermano, hay demasiadas relaciones posibles que comparten el mismo rango de CM para distinguirlas de manera confiable.

Suponga que debe construir un árbol como el de su ejemplo, luego haga una comparación por pares de cada par de muestras (N! / 2 comparaciones) y busque las probabilidades usando la herramienta Shared cM (y, por cierto, si puede implementar algo que lo hace automáticamente, probablemente podría venderlo). A medida que aumenta el número de muestras, la probabilidad de error en el árbol general aumenta más rápido y, si bien es posible determinar candidatos para una ubicación incorrecta en el árbol, nunca puede estar seguro de que su hipótesis de mayor probabilidad refleje con precisión cualquier elimina o medio primos (o primos dobles; si, como dices, hay mucha endogamia en tu cultura, entonces todas las coincidencias son sospechosas).

Esta es la razón por la que la genealogía del ADN nunca se ha recomendado como reemplazo de la investigación tradicional de "rastros de papel", porque no puede serlo, al menos no en un futuro previsible. Incluso con los navegadores de cromosomas y el rastreo de segmentos en las muestras, todo lo que realmente puede probar es quién tiene ancestros comunes y, posiblemente, qué tan atrás.

Me doy cuenta de que mi justificación puede sufrir lo que mis colegas y yo llamamos "prueba por falta de imaginación" (como en "No puedo imaginar cómo podría funcionar esto"), así que si alguien puede señalar una falla significativa en mi argumento , por favor hazlo (me ayuda tanto como a cualquier otra persona).