पायथन - टेक्स्ट प्रोसेसिंग स्टेट मशीन
एक राज्य मशीन एक आवेदन में प्रवाह को नियंत्रित करने के लिए एक कार्यक्रम डिजाइन करने के बारे में है। यह एक निर्देशित ग्राफ़ है, जिसमें नोड्स का एक सेट और संक्रमण कार्यों का एक सेट शामिल है। एक टेक्स्ट फ़ाइल को संसाधित करना अक्सर एक टेक्स्ट फ़ाइल के प्रत्येक भाग के क्रमिक पढ़ने के होते हैं और प्रत्येक चंक रीड के जवाब में कुछ करते हैं। एक चंक का अर्थ इस बात पर निर्भर करता है कि इसके पहले किस प्रकार के चोंच मौजूद थे और इसके बाद कौन सा हिस्सा आता है। मशीन एक आवेदन में प्रवाह को नियंत्रित करने के लिए एक कार्यक्रम डिजाइन करने के बारे में है। यह एक निर्देशित ग्राफ़ है, जिसमें नोड्स का एक सेट और संक्रमण कार्यों का एक सेट शामिल है। एक टेक्स्ट फ़ाइल को संसाधित करना अक्सर एक टेक्स्ट फ़ाइल के प्रत्येक भाग के क्रमिक पढ़ने के होते हैं और प्रत्येक चंक रीड के जवाब में कुछ करते हैं। एक चंक का अर्थ इस बात पर निर्भर करता है कि इसके पहले किस प्रकार के चोंच मौजूद थे और इसके बाद कौन सा हिस्सा आता है।
एक परिदृश्य पर विचार करें जहां पाठ को एजीसी के अनुक्रम की पुनरावृत्ति का लगातार तार होना चाहिए (प्रोटीन विश्लेषण में उपयोग किया जाता है)। यदि इस विशिष्ट अनुक्रम को इनपुट स्ट्रिंग में बनाए रखा जाता है तो मशीन की स्थिति TRUE रहती है लेकिन जैसे ही अनुक्रम विचलित होता है, मशीन की स्थिति FALSE हो जाती है और वार्डों के बाद FALSE बनी रहती है। यह सुनिश्चित करता है कि आगे की प्रक्रिया बंद कर दी गई है, हालांकि बाद में उपलब्ध सही अनुक्रमों के और अधिक विखंडन हो सकते हैं।
नीचे दिए गए कार्यक्रम में एक राज्य मशीन को परिभाषित किया गया है जिसमें मशीन को शुरू करने के लिए फ़ंक्शन हैं, पाठ प्रसंस्करण के लिए इनपुट लेते हैं और प्रसंस्करण के माध्यम से कदम उठाते हैं।
class StateMachine:
# Initialize
def start(self):
self.state = self.startState
# Step through the input
def step(self, inp):
(s, o) = self.getNextValues(self.state, inp)
self.state = s
return o
# Loop through the input
def feeder(self, inputs):
self.start()
return [self.step(inp) for inp in inputs]
# Determine the TRUE or FALSE state
class TextSeq(StateMachine):
startState = 0
def getNextValues(self, state, inp):
if state == 0 and inp == 'A':
return (1, True)
elif state == 1 and inp == 'G':
return (2, True)
elif state == 2 and inp == 'C':
return (0, True)
else:
return (3, False)
InSeq = TextSeq()
x = InSeq.feeder(['A','A','A'])
print x
y = InSeq.feeder(['A', 'G', 'C', 'A', 'C', 'A', 'G'])
print y
जब हम उपरोक्त कार्यक्रम चलाते हैं, तो हमें निम्न आउटपुट मिलते हैं -
[True, False, False]
[True, True, True, True, False, False, False]
X के परिणाम में, AGC का पैटर्न पहले 'ए' के बाद दूसरे इनपुट के लिए विफल हो जाता है। परिणाम की स्थिति इसके बाद हमेशा के लिए झूठी हो जाती है। Y के परिणाम में, AGC का पैटर्न 4 वें इनपुट तक जारी रहता है। इसलिए परिणाम की स्थिति उस बिंदु तक सही रहती है। लेकिन 5 वें इनपुट से परिणाम बदल जाता है क्योंकि जी अपेक्षित है, लेकिन सी पाया जाता है।