बायोपथॉन - फेनोटाइप माइक्रोएरे
फेनोटाइप को एक विशेष रासायनिक या पर्यावरण के खिलाफ एक जीव द्वारा प्रदर्शित अवलोकन चरित्र या विशेषता के रूप में परिभाषित किया गया है। फेनोटाइप माइक्रोएरे एक साथ बड़ी संख्या में रसायनों और पर्यावरण के खिलाफ एक जीव की प्रतिक्रिया को मापता है और जीन उत्परिवर्तन, जीन वर्ण आदि को समझने के लिए डेटा का विश्लेषण करता है।
बायोप्थॉन फेनोटाइपिक डेटा का विश्लेषण करने के लिए एक उत्कृष्ट मॉड्यूल, बायो.फेनोटाइप प्रदान करता है। आइए इस अध्याय में फेनोटाइप माइक्रोएरे डेटा को पार्स, इंटरपोलेट, एक्सट्रैक्ट करने और विश्लेषण करने का तरीका जानें।
पदच्छेद
फेनोटाइप माइक्रोएरे डेटा दो स्वरूपों में हो सकता है: CSV और JSON। बायोपथॉन दोनों प्रारूपों का समर्थन करता है। Biopython Parser फेनोटाइप माइक्रोएरे डेटा को पार्स करता है और प्लेटरकार्ड ऑब्जेक्ट्स के संग्रह के रूप में लौटता है। प्रत्येक प्लेटRecord ऑब्जेक्ट में WellRecord ऑब्जेक्ट का संग्रह होता है। प्रत्येक WellRecord ऑब्जेक्ट 8 पंक्तियों और 12 कॉलम प्रारूप में डेटा रखता है। आठ पंक्तियों का प्रतिनिधित्व ए से एच और 12 कॉलम का प्रतिनिधित्व 01 से 12 तक किया जाता है। उदाहरण के लिए, 4 वें पंक्ति और 6 वें कॉलम को D06 द्वारा दर्शाया जाता है।
आइए निम्न उदाहरण के साथ प्रारूपण और पार्सिंग की अवधारणा को समझते हैं -
Step 1 - बायोपथॉन टीम द्वारा प्रदान की गई प्लेट्स.एससीवी फ़ाइल डाउनलोड करें - https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/Plates.csv
Step 2 - नीचे के रूप में फिनोटपे मॉड्यूल लोड करें -
>>> from Bio import phenotype
Step 3- डेटा फ़ाइल और प्रारूप विकल्प ("pm-csv") पास करने के लिए phenotyp.parse विधि लागू करें। यह नीचे दिए गए पुन: प्रयोज्य प्लेटकार्ड को लौटाता है,
>>> plates = list(phenotype.parse('Plates.csv', "pm-csv"))
>>> plates
[PlateRecord('WellRecord['A01'], WellRecord['A02'], WellRecord['A03'], ..., WellRecord['H12']'),
PlateRecord('WellRecord['A01'], WellRecord['A02'], WellRecord['A03'], ..., WellRecord['H12']'),
PlateRecord('WellRecord['A01'], WellRecord['A02'], WellRecord['A03'], ..., WellRecord['H12']'),
PlateRecord('WellRecord['A01'], WellRecord['A02'],WellRecord['A03'], ..., WellRecord['H12']')]
>>>
Step 4 - नीचे दी गई सूची से पहली प्लेट को एक्सेस करें -
>>> plate = plates[0]
>>> plate
PlateRecord('WellRecord['A01'], WellRecord['A02'], WellRecord['A03'], ...,
WellRecord['H12']')
>>>
Step 5- जैसा कि पहले चर्चा की गई है, एक प्लेट में 8 पंक्तियाँ होती हैं जिनमें से प्रत्येक में 12 आइटम होते हैं। WellRecord को नीचे बताए अनुसार दो तरीकों से एक्सेस किया जा सकता है -
>>> well = plate["A04"]
>>> well = plate[0, 4]
>>> well WellRecord('(0.0, 0.0), (0.25, 0.0), (0.5, 0.0), (0.75, 0.0),
(1.0, 0.0), ..., (71.75, 388.0)')
>>>
Step 6 - प्रत्येक कुएं में अलग-अलग समय बिंदुओं पर माप की श्रृंखला होगी और इसे नीचे दिए गए अनुसार लूप के लिए उपयोग किया जा सकता है -
>>> for v1, v2 in well:
... print(v1, v2)
...
0.0 0.0
0.25 0.0
0.5 0.0
0.75 0.0
1.0 0.0
...
71.25 388.0
71.5 388.0
71.75 388.0
>>>
प्रक्षेप
प्रक्षेप डेटा में अधिक अंतर्दृष्टि देता है। Biopython मध्यवर्ती समय बिंदुओं की जानकारी प्राप्त करने के लिए WellRecord डेटा को प्रक्षेपित करने के तरीके प्रदान करता है। सिंटैक्स सूची अनुक्रमण के समान है और इसलिए, सीखना आसान है।
20.1 घंटे पर डेटा प्राप्त करने के लिए, बस नीचे दिए गए अनुसार सूचकांक मानों को पास करें -
>>> well[20.10]
69.40000000000003
>>>
हम प्रारंभ समय बिंदु और अंतिम समय बिंदु और साथ ही नीचे निर्दिष्ट कर सकते हैं -
>>> well[20:30]
[67.0, 84.0, 102.0, 119.0, 135.0, 147.0, 158.0, 168.0, 179.0, 186.0]
>>>
उपरोक्त कमांड 1 घंटे के अंतराल के साथ 20 घंटे से 30 घंटे तक डेटा प्रक्षेपित करता है। डिफ़ॉल्ट रूप से, अंतराल 1 घंटा है और हम इसे किसी भी मान में बदल सकते हैं। उदाहरण के लिए, नीचे दिए अनुसार 15 मिनट (0.25 घंटे) का अंतराल दें।
>>> well[20:21:0.25]
[67.0, 73.0, 75.0, 81.0]
>>>
विश्लेषण और निकालें
बायोपथॉन, गोम्पर्ट्ज़, लॉजिस्टिक और रिचर्ड्स सिग्मॉइड फ़ंक्शन का उपयोग करके वेलकार्ड डेटा का विश्लेषण करने के लिए एक विधि फिट प्रदान करता है। डिफ़ॉल्ट रूप से, फिट विधि Gompertz फ़ंक्शन का उपयोग करती है। हमें कार्य पूरा करने के लिए वेलरकार्ड ऑब्जेक्ट की फिट विधि को कॉल करने की आवश्यकता है। कोडिंग इस प्रकार है -
>>> well.fit()
Traceback (most recent call last):
...
Bio.MissingPythonDependencyError: Install scipy to extract curve parameters.
>>> well.model
>>> getattr(well, 'min') 0.0
>>> getattr(well, 'max') 388.0
>>> getattr(well, 'average_height')
205.42708333333334
>>>
बायोपथॉन स्कैपी मॉड्यूल पर निर्भर करता है ताकि उन्नत विश्लेषण किया जा सके। यह scipy मॉड्यूल का उपयोग किए बिना न्यूनतम, अधिकतम और average_height विवरणों की गणना करेगा।