बायोपथॉन - जनसंख्या आनुवंशिकी

विकास सिद्धांत में जनसंख्या आनुवंशिकी एक महत्वपूर्ण भूमिका निभाती है। यह प्रजातियों और साथ ही एक ही प्रजाति के भीतर दो या दो से अधिक व्यक्तियों के बीच आनुवंशिक अंतर का विश्लेषण करता है।

Biopython जनसंख्या आनुवंशिकी के लिए Bio.PopGen मॉड्यूल प्रदान करता है और मुख्य रूप से `GenePop, मिशेल रेमंड और फ्रेंकोइस रूसेसेट द्वारा विकसित एक लोकप्रिय आनुवंशिकी पैकेज का समर्थन करता है।

एक साधारण पार्सर

हमें जीनपॉप प्रारूप को पार्स करने और अवधारणा को समझने के लिए एक सरल एप्लिकेशन लिखें।

नीचे दिए गए लिंक में बायोपथॉन टीम द्वारा प्रदान की गई जीनपॉप फ़ाइल डाउनलोड करें -https://raw.githubusercontent.com/biopython/biopython/master/Tests/PopGen/c3line.gen

नीचे कोड स्निपेट का उपयोग करके जीनपॉप मॉड्यूल लोड करें -

from Bio.PopGen import GenePop

नीचे के रूप में GenePop.read पद्धति का उपयोग करके फ़ाइल को पार्स करें -

record = GenePop.read(open("c3line.gen"))

नीचे दिए गए अनुसार लोकी और जनसंख्या की जानकारी दिखाएं -

>>> record.loci_list 
['136255903', '136257048', '136257636'] 
>>> record.pop_list 
['4', 'b3', '5'] 
>>> record.populations 
[[('1', [(3, 3), (4, 4), (2, 2)]), ('2', [(3, 3), (3, 4), (2, 2)]), 
   ('3', [(3, 3), (4, 4), (2, 2)]), ('4', [(3, 3), (4, 3), (None, None)])], 
[('b1', [(None, None), (4, 4), (2, 2)]), ('b2', [(None, None), (4, 4), (2, 2)]), 
   ('b3', [(None, None), (4, 4), (2, 2)])], 
[('1', [(3, 3), (4, 4), (2, 2)]), ('2', [(3, 3), (1, 4), (2, 2)]), 
   ('3', [(3, 2), (1, 1), (2, 2)]), ('4', 
   [(None, None), (4, 4), (2, 2)]), ('5', [(3, 3), (4, 4), (2, 2)])]] 
>>>

यहाँ, फ़ाइल में तीन लोकी और जनसंख्या के तीन सेट उपलब्ध हैं: पहली जनसंख्या में 4 रिकॉर्ड हैं, दूसरी जनसंख्या में 3 रिकॉर्ड हैं और तीसरी जनसंख्या में 5 रिकॉर्ड हैं। record.populations प्रत्येक स्थान के लिए एलील डेटा के साथ जनसंख्या के सभी सेट दिखाता है।

GenePop फ़ाइल में हेरफेर करें

बायोपथॉन लोकस और जनसंख्या डेटा को हटाने के लिए विकल्प प्रदान करता है।

Remove a population set by position,

>>> record.remove_population(0) 
>>> record.populations 
[[('b1', [(None, None), (4, 4), (2, 2)]), 
   ('b2', [(None, None), (4, 4), (2, 2)]), 
   ('b3', [(None, None), (4, 4), (2, 2)])], 
   [('1', [(3, 3), (4, 4), (2, 2)]), 
   ('2', [(3, 3), (1, 4), (2, 2)]), 
   ('3', [(3, 2), (1, 1), (2, 2)]), 
   ('4', [(None, None), (4, 4), (2, 2)]), 
   ('5', [(3, 3), (4, 4), (2, 2)])]]
>>>

Remove a locus by position,

>>> record.remove_locus_by_position(0) 
>>> record.loci_list 
['136257048', '136257636'] 
>>> record.populations 
[[('b1', [(4, 4), (2, 2)]), ('b2', [(4, 4), (2, 2)]), ('b3', [(4, 4), (2, 2)])], 
   [('1', [(4, 4), (2, 2)]), ('2', [(1, 4), (2, 2)]), 
   ('3', [(1, 1), (2, 2)]), ('4', [(4, 4), (2, 2)]), ('5', [(4, 4), (2, 2)])]]
>>>

Remove a locus by name,

>>> record.remove_locus_by_name('136257636') >>> record.loci_list 
['136257048'] 
>>> record.populations 
[[('b1', [(4, 4)]), ('b2', [(4, 4)]), ('b3', [(4, 4)])], 
   [('1', [(4, 4)]), ('2', [(1, 4)]), 
   ('3', [(1, 1)]), ('4', [(4, 4)]), ('5', [(4, 4)])]]
>>>

जीनपॉप सॉफ्टवेयर के साथ इंटरफेस

बायोपथॉन जीनपॉप सॉफ्टवेयर के साथ बातचीत करने के लिए इंटरफेस प्रदान करता है और इस तरह से बहुत अधिक कार्यक्षमता को उजागर करता है। इस उद्देश्य के लिए Bio.PopGen.GenePop मॉड्यूल का उपयोग किया जाता है। इंटरफ़ेस का उपयोग करने के लिए एक ऐसा आसान ईज़ीकंट्रोलर है। चलिए देखते हैं कि GenePop फ़ाइल को पार्स कैसे करें और EasyController का उपयोग करके कुछ विश्लेषण करें।

सबसे पहले, जीनपॉप सॉफ़्टवेयर को इंस्टॉल करें और इंस्टॉलेशन पथ को सिस्टम पथ में रखें। GenePop फ़ाइल के बारे में बुनियादी जानकारी प्राप्त करने के लिए, एक EasyController ऑब्जेक्ट बनाएं और फिर get_basic_info पद्धति को नीचे निर्दिष्ट करें।

>>> from Bio.PopGen.GenePop.EasyController import EasyController 
>>> ec = EasyController('c3line.gen') 
>>> print(ec.get_basic_info()) 
(['4', 'b3', '5'], ['136255903', '136257048', '136257636'])
>>>

यहां, पहला आइटम जनसंख्या सूची और दूसरा आइटम लोकी सूची है।

किसी विशेष स्थान की सभी एलील सूची प्राप्त करने के लिए, नीचे दिए गए स्थान नाम से पास करके get_alleles_all_pops विधि को कॉल करें।

>>> allele_list = ec.get_alleles_all_pops("136255903") 
>>> print(allele_list) 
[2, 3]

विशिष्ट जनसंख्या और नियंत्रण रेखा द्वारा एलील सूची प्राप्त करने के लिए, नीचे दिए गए अनुसार लोकल नाम और जनसंख्या की स्थिति पास करके get_alleles को कॉल करें -

>>> allele_list = ec.get_alleles(0, "136255903") 
>>> print(allele_list) 
[] 
>>> allele_list = ec.get_alleles(1, "136255903") 
>>> print(allele_list) 
[] 
>>> allele_list = ec.get_alleles(2, "136255903") 
>>> print(allele_list) 
[2, 3] 
>>>

इसी तरह, EasyController कई कार्यशीलता को उजागर करता है: एलील फ़्रीक्वेंसी, जीनोटाइप फ़्रीक्वेंसी, मल्टीलोकस एफ आँकड़े, हार्डी-वेनबर्ग संतुलन, लिंकेज डेसीक्विलिब्रियम, आदि।