Biopython - Genetika Populasi
Genetika populasi memainkan peran penting dalam teori evolusi. Ini menganalisis perbedaan genetik antara spesies serta dua atau lebih individu dalam spesies yang sama.
Biopython menyediakan modul Bio.PopGen untuk genetika populasi dan terutama mendukung `GenePop, paket genetika populer yang dikembangkan oleh Michel Raymond dan Francois Rousset.
Pengurai sederhana
Mari kita tulis aplikasi sederhana untuk mengurai format GenePop dan memahami konsepnya.
Unduh file genePop yang disediakan oleh tim Biopython di tautan yang diberikan di bawah ini -https://raw.githubusercontent.com/biopython/biopython/master/Tests/PopGen/c3line.gen
Muat modul GenePop menggunakan potongan kode di bawah ini -
from Bio.PopGen import GenePop
Parse file menggunakan metode GenePop.read seperti di bawah ini -
record = GenePop.read(open("c3line.gen"))
Tunjukkan lokus dan informasi populasi seperti yang diberikan di bawah ini -
>>> record.loci_list
['136255903', '136257048', '136257636']
>>> record.pop_list
['4', 'b3', '5']
>>> record.populations
[[('1', [(3, 3), (4, 4), (2, 2)]), ('2', [(3, 3), (3, 4), (2, 2)]),
('3', [(3, 3), (4, 4), (2, 2)]), ('4', [(3, 3), (4, 3), (None, None)])],
[('b1', [(None, None), (4, 4), (2, 2)]), ('b2', [(None, None), (4, 4), (2, 2)]),
('b3', [(None, None), (4, 4), (2, 2)])],
[('1', [(3, 3), (4, 4), (2, 2)]), ('2', [(3, 3), (1, 4), (2, 2)]),
('3', [(3, 2), (1, 1), (2, 2)]), ('4',
[(None, None), (4, 4), (2, 2)]), ('5', [(3, 3), (4, 4), (2, 2)])]]
>>>
Di sini, ada tiga lokus yang tersedia dalam file dan tiga kumpulan populasi: Populasi pertama memiliki 4 record, populasi kedua memiliki 3 record dan populasi ketiga memiliki 5 record. record.populations menunjukkan semua kumpulan populasi dengan data alel untuk setiap lokus.
Memanipulasi file GenePop
Biopython memberikan opsi untuk menghapus lokus dan data populasi.
Remove a population set by position,
>>> record.remove_population(0)
>>> record.populations
[[('b1', [(None, None), (4, 4), (2, 2)]),
('b2', [(None, None), (4, 4), (2, 2)]),
('b3', [(None, None), (4, 4), (2, 2)])],
[('1', [(3, 3), (4, 4), (2, 2)]),
('2', [(3, 3), (1, 4), (2, 2)]),
('3', [(3, 2), (1, 1), (2, 2)]),
('4', [(None, None), (4, 4), (2, 2)]),
('5', [(3, 3), (4, 4), (2, 2)])]]
>>>
Remove a locus by position,
>>> record.remove_locus_by_position(0)
>>> record.loci_list
['136257048', '136257636']
>>> record.populations
[[('b1', [(4, 4), (2, 2)]), ('b2', [(4, 4), (2, 2)]), ('b3', [(4, 4), (2, 2)])],
[('1', [(4, 4), (2, 2)]), ('2', [(1, 4), (2, 2)]),
('3', [(1, 1), (2, 2)]), ('4', [(4, 4), (2, 2)]), ('5', [(4, 4), (2, 2)])]]
>>>
Remove a locus by name,
>>> record.remove_locus_by_name('136257636') >>> record.loci_list
['136257048']
>>> record.populations
[[('b1', [(4, 4)]), ('b2', [(4, 4)]), ('b3', [(4, 4)])],
[('1', [(4, 4)]), ('2', [(1, 4)]),
('3', [(1, 1)]), ('4', [(4, 4)]), ('5', [(4, 4)])]]
>>>
Antarmuka dengan Perangkat Lunak GenePop
Biopython menyediakan antarmuka untuk berinteraksi dengan perangkat lunak GenePop dan dengan demikian memperlihatkan banyak fungsi darinya. Modul Bio.PopGen.GenePop digunakan untuk tujuan ini. Salah satu antarmuka yang mudah digunakan adalah EasyController. Mari kita periksa cara mengurai file GenePop dan melakukan beberapa analisis menggunakan EasyController.
Pertama, instal perangkat lunak GenePop dan tempatkan folder instalasi di jalur sistem. Untuk mendapatkan informasi dasar tentang file GenePop, buat objek EasyController dan panggil metode get_basic_info seperti yang ditentukan di bawah ini -
>>> from Bio.PopGen.GenePop.EasyController import EasyController
>>> ec = EasyController('c3line.gen')
>>> print(ec.get_basic_info())
(['4', 'b3', '5'], ['136255903', '136257048', '136257636'])
>>>
Di sini, item pertama adalah daftar populasi dan item kedua adalah daftar lokus.
Untuk mendapatkan semua daftar alel dari lokus tertentu, panggil metode get_alleles_all_pops dengan meneruskan nama lokus seperti yang ditentukan di bawah ini -
>>> allele_list = ec.get_alleles_all_pops("136255903")
>>> print(allele_list)
[2, 3]
Untuk mendapatkan daftar alel berdasarkan populasi dan lokus tertentu, panggil get_alleles dengan meneruskan nama lokus dan posisi populasi seperti yang diberikan di bawah ini -
>>> allele_list = ec.get_alleles(0, "136255903")
>>> print(allele_list)
[]
>>> allele_list = ec.get_alleles(1, "136255903")
>>> print(allele_list)
[]
>>> allele_list = ec.get_alleles(2, "136255903")
>>> print(allele_list)
[2, 3]
>>>
Demikian pula, EasyController memperlihatkan banyak fungsi: frekuensi alel, frekuensi genotipe, statistik F multilokus, kesetimbangan Hardy-Weinberg, Ketidakseimbangan Tautan, dll.