कंपाइलर डिज़ाइन - बॉटम-अप पार्सर

बॉटम-अप पार्सिंग एक पेड़ के पत्ती नोड्स से शुरू होता है और जड़ नोड तक पहुंचने तक ऊपर की दिशा में काम करता है। यहां, हम एक वाक्य से शुरू करते हैं और फिर उत्पादन प्रतीक को उल्टे तरीके से लागू करते हैं ताकि प्रारंभ प्रतीक तक पहुंच सकें। नीचे दी गई छवि नीचे उपलब्ध पार्सर्स को दर्शाती है।

पारी को कम करना

शिफ्ट-कम पार्सिंग नीचे-अप पार्सिंग के लिए दो अद्वितीय चरणों का उपयोग करता है। इन चरणों को शिफ्ट-स्टेप और कम-स्टेप के रूप में जाना जाता है।

  • Shift step: पारी कदम अगले इनपुट प्रतीक को इनपुट पॉइंटर की उन्नति को संदर्भित करता है, जिसे स्थानांतरित प्रतीक कहा जाता है। यह प्रतीक स्टैक पर धकेल दिया जाता है। शिफ्ट किए गए प्रतीक को पार्स ट्री के एकल नोड के रूप में माना जाता है।

  • Reduce step: जब पार्सर एक पूर्ण व्याकरण नियम (आरएचएस) पाता है और इसे (एलएचएस) की जगह लेता है, तो इसे कम-चरण के रूप में जाना जाता है। यह तब होता है जब स्टैक के शीर्ष में एक हैंडल होता है। कम करने के लिए, एक पीओपी फ़ंक्शन स्टैक पर किया जाता है जो हैंडल से पॉप होता है और इसे एलएचएस गैर-टर्मिनल प्रतीक के साथ बदल देता है।

LR पार्सर

LR पार्सर एक गैर-पुनरावर्ती, शिफ्ट-कम, बॉटम-अप पार्सर है। यह संदर्भ-मुक्त व्याकरण की एक विस्तृत श्रेणी का उपयोग करता है जो इसे सबसे कुशल वाक्यविन्यास विश्लेषण तकनीक बनाता है। LR पार्सर को LR (k) पार्सर के रूप में भी जाना जाता है, जहां L इनपुट स्ट्रीम के बाएं से दाएं स्कैनिंग के लिए खड़ा है; R का अर्थ है रिवर्स में सबसे अधिक व्युत्पत्ति का निर्माण, और k निर्णय लेने के लिए लुकहेड प्रतीकों की संख्या को दर्शाता है।

LR पार्सर के निर्माण के लिए तीन व्यापक रूप से उपयोग किए गए एल्गोरिदम उपलब्ध हैं:

  • एसएलआर (1) - सरल एलआर पार्सर:
    • व्याकरण के सबसे छोटे वर्ग पर काम करता है
    • कुछ राज्यों की संख्या, इसलिए बहुत छोटी तालिका
    • सरल और तेज निर्माण
  • LR (1) - LR पार्सर:
    • LR (1) व्याकरण के पूर्ण सेट पर काम करता है
    • बड़ी तालिका और बड़ी संख्या में राज्य बनाता है
    • धीमी गति से निर्माण
  • LALR (1) - देखो आगे LR पार्सर:
    • व्याकरण के मध्यवर्ती आकार पर काम करता है
    • राज्यों की संख्या SLR (1) के समान है

एलआर पार्सिंग एल्गोरिथम

यहाँ हम एक LR पार्सर के कंकाल एल्गोरिथ्म का वर्णन करते हैं:

token = next_token()

repeat forever
   s = top of stack
   
   if action[s, token] = “shift si” then
      PUSH token
      PUSH si 
      token = next_token()
      
   else if action[s, token] = “reduce A::= β“ then 
      POP 2 * |β| symbols
      s = top of stack
      PUSH A
      PUSH goto[s,A]
      
   else if action[s, token] = “accept” then
      return
      
   else
      error()

एलएल बनाम एलआर

डालूँगा एलआर
एक बाईं ओर व्युत्पन्न करता है। रिवर्स में एक सही व्युत्पत्ति करता है।
स्टैक पर रूट नॉनटर्मिनल से शुरू होता है। स्टैक पर रूट नॉनटर्मिनल के साथ समाप्त होता है।
समाप्त होता है जब स्टैक खाली होता है। एक खाली ढेर के साथ शुरू होता है।
अभी भी अपेक्षित होने के लिए स्टैकिंग का उपयोग करता है। जो पहले से ही देखा गया है उसे नामित करने के लिए स्टैक का उपयोग करता है।
पार्स ट्री को ऊपर-नीचे बनाता है। पार्स ट्री को बॉटम-अप बनाता है।
स्टैक से लगातार एक नॉनटर्मिनल पॉप करता है, और इसी दाहिने हाथ की तरफ धक्का देता है। स्टैक पर एक दाहिने हाथ की ओर पहचानने की कोशिश करता है, इसे पॉप करता है, और संबंधित नॉनटर्मिनल को धक्का देता है।
गैर-टर्मिनलों का विस्तार करता है। गैर-टर्मिनलों को कम करता है।
टर्मिनलों को पढ़ता है जब यह स्टैक से एक को पॉप करता है। टर्मिनलों को पढ़ता है जबकि यह उन्हें स्टैक पर धकेलता है।
पार्स ट्री का पूर्व-क्रम ट्रावेल। पार्स ट्री का पोस्ट-ऑर्डर ट्रैवर्सल।