कंपाइलर डिज़ाइन - बॉटम-अप पार्सर
बॉटम-अप पार्सिंग एक पेड़ के पत्ती नोड्स से शुरू होता है और जड़ नोड तक पहुंचने तक ऊपर की दिशा में काम करता है। यहां, हम एक वाक्य से शुरू करते हैं और फिर उत्पादन प्रतीक को उल्टे तरीके से लागू करते हैं ताकि प्रारंभ प्रतीक तक पहुंच सकें। नीचे दी गई छवि नीचे उपलब्ध पार्सर्स को दर्शाती है।
पारी को कम करना
शिफ्ट-कम पार्सिंग नीचे-अप पार्सिंग के लिए दो अद्वितीय चरणों का उपयोग करता है। इन चरणों को शिफ्ट-स्टेप और कम-स्टेप के रूप में जाना जाता है।
Shift step: पारी कदम अगले इनपुट प्रतीक को इनपुट पॉइंटर की उन्नति को संदर्भित करता है, जिसे स्थानांतरित प्रतीक कहा जाता है। यह प्रतीक स्टैक पर धकेल दिया जाता है। शिफ्ट किए गए प्रतीक को पार्स ट्री के एकल नोड के रूप में माना जाता है।
Reduce step: जब पार्सर एक पूर्ण व्याकरण नियम (आरएचएस) पाता है और इसे (एलएचएस) की जगह लेता है, तो इसे कम-चरण के रूप में जाना जाता है। यह तब होता है जब स्टैक के शीर्ष में एक हैंडल होता है। कम करने के लिए, एक पीओपी फ़ंक्शन स्टैक पर किया जाता है जो हैंडल से पॉप होता है और इसे एलएचएस गैर-टर्मिनल प्रतीक के साथ बदल देता है।
LR पार्सर
LR पार्सर एक गैर-पुनरावर्ती, शिफ्ट-कम, बॉटम-अप पार्सर है। यह संदर्भ-मुक्त व्याकरण की एक विस्तृत श्रेणी का उपयोग करता है जो इसे सबसे कुशल वाक्यविन्यास विश्लेषण तकनीक बनाता है। LR पार्सर को LR (k) पार्सर के रूप में भी जाना जाता है, जहां L इनपुट स्ट्रीम के बाएं से दाएं स्कैनिंग के लिए खड़ा है; R का अर्थ है रिवर्स में सबसे अधिक व्युत्पत्ति का निर्माण, और k निर्णय लेने के लिए लुकहेड प्रतीकों की संख्या को दर्शाता है।
LR पार्सर के निर्माण के लिए तीन व्यापक रूप से उपयोग किए गए एल्गोरिदम उपलब्ध हैं:
- एसएलआर (1) - सरल एलआर पार्सर:
- व्याकरण के सबसे छोटे वर्ग पर काम करता है
- कुछ राज्यों की संख्या, इसलिए बहुत छोटी तालिका
- सरल और तेज निर्माण
- LR (1) - LR पार्सर:
- LR (1) व्याकरण के पूर्ण सेट पर काम करता है
- बड़ी तालिका और बड़ी संख्या में राज्य बनाता है
- धीमी गति से निर्माण
- LALR (1) - देखो आगे LR पार्सर:
- व्याकरण के मध्यवर्ती आकार पर काम करता है
- राज्यों की संख्या SLR (1) के समान है
एलआर पार्सिंग एल्गोरिथम
यहाँ हम एक LR पार्सर के कंकाल एल्गोरिथ्म का वर्णन करते हैं:
token = next_token()
repeat forever
s = top of stack
if action[s, token] = “shift si” then
PUSH token
PUSH si
token = next_token()
else if action[s, token] = “reduce A::= β“ then
POP 2 * |β| symbols
s = top of stack
PUSH A
PUSH goto[s,A]
else if action[s, token] = “accept” then
return
else
error()
एलएल बनाम एलआर
डालूँगा | एलआर |
---|---|
एक बाईं ओर व्युत्पन्न करता है। | रिवर्स में एक सही व्युत्पत्ति करता है। |
स्टैक पर रूट नॉनटर्मिनल से शुरू होता है। | स्टैक पर रूट नॉनटर्मिनल के साथ समाप्त होता है। |
समाप्त होता है जब स्टैक खाली होता है। | एक खाली ढेर के साथ शुरू होता है। |
अभी भी अपेक्षित होने के लिए स्टैकिंग का उपयोग करता है। | जो पहले से ही देखा गया है उसे नामित करने के लिए स्टैक का उपयोग करता है। |
पार्स ट्री को ऊपर-नीचे बनाता है। | पार्स ट्री को बॉटम-अप बनाता है। |
स्टैक से लगातार एक नॉनटर्मिनल पॉप करता है, और इसी दाहिने हाथ की तरफ धक्का देता है। | स्टैक पर एक दाहिने हाथ की ओर पहचानने की कोशिश करता है, इसे पॉप करता है, और संबंधित नॉनटर्मिनल को धक्का देता है। |
गैर-टर्मिनलों का विस्तार करता है। | गैर-टर्मिनलों को कम करता है। |
टर्मिनलों को पढ़ता है जब यह स्टैक से एक को पॉप करता है। | टर्मिनलों को पढ़ता है जबकि यह उन्हें स्टैक पर धकेलता है। |
पार्स ट्री का पूर्व-क्रम ट्रावेल। | पार्स ट्री का पोस्ट-ऑर्डर ट्रैवर्सल। |