Menentukan hubungan dengan sepupu semata-mata berdasarkan hubungan timbal balik dengan sepupu lainnya
Latar Belakang
Saya sedang meneliti silsilah di 23andMe.com, mencoba menemukan sepupu baru dan menentukan hubungan mereka dengan saya. Semua yang diberikan situs kepada saya adalah daftar orang dan prediksi hubungan sepupu mereka dengan saya (dapat diunduh sebagai file CSV), bersama dengan halaman tempat saya dapat melihat daftar kerabat umum di antara kita dan perbandingan perkiraan hubungan mereka dengan mereka (tidak dapat diunduh, misalnya pada halaman orang X akan tertulis, "orang Y-- Anda: sepupu ke-2, X: sepupu ke-3"). Sayangnya, dalam budaya saya, secara historis ada sejumlah besar endogami karena diskriminasi, jadi "Sepupu jauh" mungkin bisa berarti sepupu ke-10 +, atau lebih. Untuk tujuan saya, saya menganggapnya tidak terkait. Ini adalah yang terbaik yang dapat saya lakukan, mengingat bahwa 23andMe tidak memberikan akses ke kumpulan data terstruktur dari semua kerabat umum sehubungan dengan orang tertentu, sehingga menghilangkan kemungkinan mengesampingkan keterkaitan berdasarkan kurangnya kerabat di kerabat lain. set kerabat umum. Oleh karena itu, jika saya melihat di profil orang Z bahwa mereka adalah sepupu jauh dari beberapa sepupu saya dari pihak ayah saya, dan mereka adalah sepupu ke-3 dari orang A yang saya tidak yakin, saya akan beralasan bahwa orang Z itu ada di pihak ibu saya. , seperti orang A.
Masalah
Penalaran tentang informasi berupa "Jika Anda sepupu ke-2 dengan X dan jauh dengan Y, Z, A, dan B, dan X adalah sepupu ke-3 dengan C, ke-4 dengan D, dan jauh dengan E, maka mungkin hubungannya adalah ... "telah menjadi sangat sulit dan tidak membuahkan sedikit hasil.
Pertanyaan
Apakah mungkin untuk menentukan hubungan orang-ke-orang yang tepat dengan sepupu hanya berdasarkan hubungan Anda dengan sepupu yang sama vs. hubungan mereka dengan sepupu yang sama, dan sepupu dengan sepupu lain, dll.? Jika demikian, bagaimana cara menentukan hubungan?
Jika itu tidak jelas, berikut adalah contoh untuk mengilustrasikan pertanyaan tersebut:
Katakanlah saya dan sepupu ke-3 X tidak tahu bagaimana kita berhubungan, tetapi sepupu A: X adalah sepupu ke-2 dengan A, saya sepupu ke-4 dengan A. X juga sepupu ke-3 dengan sepupu bersama B, dan B adalah sepupu ke-2 dengan (berbagi) sepupu C yang saya tahu adalah sepupu ke-2 dari pihak ayah saya, dll. Dengan melalui proses ini cukup sering dan mendokumentasikan informasi saat saya pergi atau menggambar grafik di atas pohon, dapatkah saya menyimpulkan bahwa, misalnya, sepupu X pasti sepupu dari pihak ayah nenek saya? Apakah itu mungkin? Bagaimana saya bisa melakukan itu?
Kemajuan sejauh ini
Kadang-kadang Anda belajar lebih banyak dari apa yang tidak Anda ketahui daripada dari apa yang Anda lakukan, dan seringkali itu membuat arah penelitian di masa depan lebih jelas ketika Anda memahami apa yang tidak Anda ketahui, jadi inilah
Apa yang saya tidak tahu
Setelah pertimbangan panjang tentang masalah tersebut, kesimpulan yang saya dapatkan adalah bahwa empat pertanyaan berikut adalah inti dari apakah pertanyaan itu dapat dijawab dan bagaimana itu akan dilakukan (mungkin saya salah dan ini bukan inti dari pertanyaan itu) :
- Bagaimana cara menentukan apakah dua orang berasal dari kakek-nenek yang sama?
- Bagaimana saya menentukan dari sisi mana setiap orang adalah keturunan kakek-nenek itu? (yaitu kakek dari pihak ibu X dan nenek dari pihak ibu Y)?
- Bagaimana cara melacak hubungan itu (terutama penting jika saya menulis program untuk melakukannya)?
- Secara umum, seberapa besar Anda dapat benar-benar menentukan hanya dengan mengetahui hubungan sepupu dengan orang? Apakah salah satu dari hal-hal ini mungkin untuk ditentukan?
Apa yang saya tahu
Apa yang telah saya tentukan sejauh ini:
Diketahui: A adalah sepupu ke-n dari C dan B adalah sepupu ke-n dari C
- Untuk dengan yakin mengatakan bahwa A, B, dan C berbagi kakek buyut yang sama: A dan B juga harus sepupu n satu sama lain.
Tapi itu jarang terjadi, dan dengan demikian, aturan ini tidak membawa saya terlalu jauh. Ini juga belum membantu karena tidak menjelaskan bagaimana menentukan dari sisi mana kakek nenek biasa berasal.
Solusi yang monoton bukanlah penghalang
Bahkan jika jawaban atas pertanyaan saya adalah metode yang melibatkan banyak trial and error, monoton, dll, selama metode itu sangat metodis (dalam pengertian matematis,) sehingga akan berhasil 100% dari waktu jika diikuti sampai akhir, saya dapat mengajarkannya ke komputer dan mengirimkan hasil tersebut ke program penghasil grafik buatan tangan saya dengan memanggil beberapa baris kode seperti ini:
graph.addEdge("Grandmother #1" ,"Father #1")
graph.addEdge("Grandmother #1", "Father #2")
graph.addEdge("Grandmother #1", "Childless #3")
graph.addEdge("Father #1", "Jimmy")
graph.addEdge("Father #2", "Sally")
graph.addEdge("Jimmy","Son #1")
graph.addEdge("Jimmy","Son #2")
graph.addEdge("Jimmy","Son #3")
Inilah yang dibuat oleh baris-baris di atas:

Kadang-kadang "bekerja 100%" berarti menentukan bahwa sesuatu tidak dapat ditentukan. Tidak apa-apa. Saya ingin berasumsi bahwa dengan referensi silang yang cukup, gambaran keseluruhan dapat diketahui. Saya berasumsi bahwa program ini akan bermanfaat bagi banyak orang, jadi jika saya mendapat bantuan untuk membuatnya, saya akan dengan senang hati mendistribusikannya agar orang lain dapat memanfaatkannya.
PS: Saya tulis sebagian
Jawaban
Sepertinya alat What Are The Odds ( WATO ) dari DNA Painter mungkin bisa membantu. Ini membantu Anda mengetahui bagaimana orang target terkait dengan sekumpulan orang lain yang hubungannya sudah diketahui, berdasarkan DNA mereka. Anda dapat membaca lebih lanjut di sini .
Ada juga versi 2 yang saat ini dalam versi beta, tetapi saya tidak dapat berbicara tentang fitur baru yang dimilikinya.
Meskipun pohon WATO telah disarankan (termasuk oleh saya) sebagai harapan terbaik Anda, saya tidak percaya bahkan pohon-pohon itu akan cukup untuk tugas yang Anda usulkan. Saya akan melangkah lebih jauh dengan mengklaim bahwa itu tidak dapat dilakukan dengan hanya menggunakan data kecocokan DNA. Setelah Anda melampaui hubungan dekat orang tua / anak, saudara kandung, dan mungkin sepupu pertama, ada terlalu banyak kemungkinan hubungan yang memiliki rentang cM yang sama untuk dapat membedakannya dengan andal.
Misalkan Anda membuat pohon seperti yang ada di contoh Anda, lalu lakukan perbandingan berpasangan dari setiap pasangan sampel (perbandingan N! / 2) dan cari probabilitas menggunakan alat cM Bersama (dan, btw, jika Anda dapat menerapkan sesuatu yang melakukannya secara otomatis, Anda mungkin bisa menjualnya). Dengan bertambahnya jumlah sampel, probabilitas kesalahan dalam pohon keseluruhan meningkat lebih cepat, dan meskipun mungkin untuk menentukan kandidat untuk penempatan yang salah di pohon, Anda tidak akan pernah bisa yakin bahwa hipotesis probabilitas tertinggi Anda secara akurat mencerminkan menghilangkan atau setengah sepupu (atau sepupu ganda - jika, seperti yang Anda katakan, ada banyak endogami dalam budaya Anda, maka semua kecocokan dicurigai).
Inilah mengapa silsilah DNA tidak pernah direkomendasikan sebagai pengganti penelitian "jejak kertas" tradisional, karena tidak mungkin, setidaknya tidak di masa mendatang. Bahkan dengan browser kromosom dan pelacakan segmen di seluruh sampel, yang benar-benar dapat Anda buktikan adalah siapa yang memiliki nenek moyang yang sama, dan mungkin seberapa jauh ke belakang.
Saya menyadari bahwa pembenaran saya mungkin menderita dari apa yang saya dan kolega saya sebut sebagai "bukti oleh kurangnya imajinasi" (seperti dalam "Saya tidak dapat membayangkan bagaimana ini bisa berhasil"), jadi jika ada yang bisa menunjukkan kesalahan yang signifikan dalam argumen saya , tolong lakukan itu (ini membantu saya seperti halnya orang lain).