他のいとことの相互関係のみに基づいて、いとことの関係を決定する

Aug 17 2020

バックグラウンド

私は23andMe.comで系図を研究しており、新しいいとこを見つけて、私との関係を判断しようとしています。すべてのサイトが私に提供するのは、私と彼らの予測されるいとこ関係のリスト(CSVファイルとしてダウンロード可能)と、私たちの間の一般的な親戚のリストと彼らとの予測される関係の比較を表示できるページです。 (ダウンロードできません。たとえば、Xさんのページには「Yさん-あなた:2番目のいとこ、X:3番目のいとこ」と表示されます)。残念ながら、私の文化では、歴史的に差別によるかなりの量の内婚があったので、「遠いいとこ」はおそらく10番目以上のいとこを意味する可能性があります。私の目的では、私はそれを無関係を意味すると解釈します。23andMeは、特定の人に関するすべての一般的な親戚の構造化されたデータセットへのアクセスを提供しないため、これは私ができる最善の方法です。一般的な親戚セット。したがって、Zさんのプロフィールで、彼らが父の側から私のいとこの数人の遠い従兄弟であり、私が確信が持てないAさんの3番目のいとこであることがわかった場合、Zさんは母の側にいると推論します。 、Aさんもそうです。

問題

「あなたがXと離れてY、Z、A、Bと離れている2番目のいとこであり、XがCと3番目のいとこであり、Dと4番目であり、Eと離れている場合、おそらく接続は次のようになります。 ...」は非常に困難になり、結果のわずかな結果を生み出していません。

質問

相互のいとことの関係と相互のいとことの関係、およびそれらのいとこと他のいとことの関係などだけに基づいて、いとことの正確な人と人との関係を決定することは可能ですか?もしそうなら、どのように関係を決定するのですか?

それが明確でない場合は、質問を説明する例を次に示し

ます。私と3番目のいとこXは、私たちがどのように関係しているかわからないが、いとこAを共有するとします。XはAの2番目のいとこであり、私はAの4番目のいとこです。 Xも共有のいとこBの3番目のいとこであり、Bは私の父の側からの私の2番目のいとこであることがわかっている(共有の)いとこCの2番目のいとこです。このプロセスを十分な回数実行し、情報を文書化するか、それを木の上にグラフ化すると、たとえば、いとこXは私の父方の祖母の父方のいとこでなければならないと推測できますか?それは可能ですか?どうやってやるの?

これまでの進捗状況

自分がしていることよりも知らないことから学ぶこともありますし、知らないことを明確にすると、将来の研究の方向性が明確になることがよくあります。

わからないこと

問題を長い間検討した結果、次の4つの質問が、質問に答えられるかどうか、そしてどのように行われるかという中心にあるという結論に達しました(おそらく私は間違っていて、これらは中心ではありません)。 :

  1. 2人が同じ祖父母から来ているかどうかをどのように判断しますか?
  2. それぞれの人がどちらの側からそれらの祖父母の子孫であるかをどのように判断しますか?(つまり、Xの母方の祖父とYの母方の祖母)?
  3. これらの関係を追跡するにはどうすればよいですか(それを実行するプログラムを作成する場合は特に重要です)。
  4. 一般的に、いとこの関係を人々と知っているだけで、実際にどれだけ判断できるでしょうか。これらのいずれかを判断することは可能ですか?

私が知っていること

私がこれまでに決定したこと:

与えられた:AはCのn番目のいとこであり、BはCのn番目のいとこです

  • A、B、およびCが同じn番目の曽祖父母を共有していると自信を持って言うには、AとBも互いにn番目のいとこである必要があります。

しかし、それが起こることはめったにないので、このルールは私をそれほど遠くまで連れて行きません。また、一般的な祖父母がどちらの側から来たのかを判断する方法が説明されていないため、まだ役に立ちません。

解の単調さは障壁ではありません

私の質問への答えが多くの試行錯誤、単調さなどを伴う方法であっても、それが(数学的な意味で)厳密に系統的であり、従うと100%の時間で機能する限り、最後まで、次のような数行のコードを呼び出すことで、コンピューターに教え、その結果を手作りのグラフ生成プログラムに送信できます。

    graph.addEdge("Grandmother #1" ,"Father #1")
    graph.addEdge("Grandmother #1", "Father #2")
    graph.addEdge("Grandmother #1", "Childless #3")
    graph.addEdge("Father #1", "Jimmy")
    graph.addEdge("Father #2", "Sally")
    graph.addEdge("Jimmy","Son #1")
    graph.addEdge("Jimmy","Son #2")
    graph.addEdge("Jimmy","Son #3")

これは、上記の行が作成するものです。


「100%動作する」とは、何かを判別できないと判断することを意味する場合があります。それで大丈夫です。十分な相互参照があれば、全体像を把握できると思います。このプログラムは多くの人に役立つと思いますので、作成の手助けがあれば、他の人が恩恵を受けることができるように配布したいと思います。
PS:私はいくつかを書いた

回答

1 PeterKühne Aug 18 2020 at 08:59

ように聞こえるDNA画家のオッズ(何WATOツールが助けになるかもしれませんが)。DNAに基づいて、ターゲットの人物が、関係がすでにわかっている他の一連の人物とどのように関連しているかを把握するのに役立ちます。あなたはそれについてもっと読むことができます。

現在ベータ版のバージョン2もありますが、その新機能についてはお話しできません。

1 cleaverkin Aug 18 2020 at 18:35

WATOの木は(私も含めて)あなたの最善の希望として提案されていますが、それでもあなたが提案するタスクに十分であるとは思いません。DNA一致データだけでは確実に実行できないと主張します。親/子、兄弟、そしておそらく従兄弟の密接な関係を超えてしまうと、同じcM範囲を共有する可能性のある関係が多すぎて、それらを確実に区別できなくなります。

例のようなツリーを構築し、各サンプルペアのペアワイズ比較(N!/ 2比較)を実行し、共有cMツールを使用して確率を検索するとします(そして、何かを実装できる場合はそれは自動的にそれをします、あなたはおそらくそれを売ることができます)。サンプル数が増えると、ツリー全体のエラーの確率が速くなり、ツリー内の誤った配置の候補を特定できる可能性がありますが、最も高い確率の仮説が正確に反映されているかどうかを確認することはできません。いとこを削除するか、半分にします(または、二重のいとこ-あなたが言うように、あなたの文化に多くの内婚がある場合、すべての一致が疑わしいです)。

これが、DNA系図が従来の「紙の証跡」研究の代わりとして推奨されたことは一度もない理由です。少なくとも予見可能な将来にはそうすることができないからです。染色体ブラウザとサンプル全体のセグメントのトレースを使用しても、実際に証明できるのは、誰が共通の祖先を持っているか、そしておそらくどれだけ前に戻ったかだけです。

私の正当化は私の同僚と私が「想像力の欠如による証明」と呼んでいるものに苦しんでいる可能性があることを理解しています(「これがどのように機能するか想像できない」のように)ので、誰かが私の議論の重大な欠陥を指摘できれば、そうしてください(それは他の誰よりも私を助けます)。