कंपाइलर डिज़ाइन - शब्दार्थ विश्लेषण
हमने सीखा है कि कैसे एक पार्सर वाक्यविन्यास विश्लेषण चरण में पार्स पेड़ों का निर्माण करता है। उस चरण में निर्मित सादे पार्स-ट्री का आमतौर पर एक संकलक के लिए कोई उपयोग नहीं होता है, क्योंकि यह पेड़ का मूल्यांकन करने के तरीके की कोई जानकारी नहीं रखता है। संदर्भ-मुक्त व्याकरण की प्रस्तुतियों, जो भाषा के नियम बनाती हैं, उन्हें समायोजित नहीं करती हैं कि उनकी व्याख्या कैसे करें।
उदाहरण के लिए
E → E + T
उपरोक्त सीएफजी उत्पादन में इसके साथ कोई अर्थ नियम नहीं जुड़ा है, और यह उत्पादन की किसी भी तरह की समझ बनाने में मदद नहीं कर सकता है।
अर्थ विज्ञान
किसी भाषा के शब्दार्थ इसके निर्माणों को अर्थ प्रदान करते हैं, जैसे टोकन और वाक्य रचना। शब्दार्थ, प्रतीकों, उनके प्रकारों और एक दूसरे के साथ उनके संबंधों की व्याख्या करने में मदद करते हैं। सिमेंटिक विश्लेषण से पता चलता है कि स्रोत कार्यक्रम में निर्मित वाक्यविन्यास संरचना किसी भी अर्थ को प्राप्त करती है या नहीं।
CFG + semantic rules = Syntax Directed Definitions
उदाहरण के लिए:
int a = “value”;
लेक्सिकल और सिंटैक्स विश्लेषण चरण में त्रुटि जारी नहीं करनी चाहिए, क्योंकि यह लेक्सिक और संरचनात्मक रूप से सही है, लेकिन इसे एक शब्दार्थ त्रुटि उत्पन्न करनी चाहिए क्योंकि असाइनमेंट का प्रकार भिन्न होता है। इन नियमों को भाषा के व्याकरण द्वारा निर्धारित किया जाता है और अर्थ विश्लेषण में मूल्यांकन किया जाता है। निम्नलिखित कार्यों को अर्थ विश्लेषण में किया जाना चाहिए:
- स्कोप रेजोल्यूशन
- प्रकार की जाँच
- एरे-बाउंड चेकिंग
शब्दार्थ त्रुटियाँ
हमने कुछ शब्दार्थ त्रुटियों का उल्लेख किया है जो अर्थ विश्लेषक को पहचानने की उम्मीद है:
- बेमेल टाइप
- अघोषित चर
- आरक्षित पहचानकर्ता दुरुपयोग।
- एक दायरे में चर की एकाधिक घोषणा।
- स्कोप वैरिएबल को एक्सेस करना।
- वास्तविक और औपचारिक पैरामीटर बेमेल।
व्याकरण की विशेषता
व्याकरण का संदर्भ संदर्भ-मुक्त व्याकरण का एक विशेष रूप है जहां संदर्भ-संवेदनशील जानकारी प्रदान करने के लिए कुछ अतिरिक्त जानकारी (विशेषताएँ) को इसके एक या अधिक गैर-टर्मिनलों से जोड़ा जाता है। प्रत्येक विशेषता में पूर्णांक, फ्लोट, चरित्र, स्ट्रिंग और भाव जैसे मानों का अच्छी तरह से परिभाषित डोमेन होता है।
व्याकरण को प्रस्तुत करना संदर्भ-मुक्त व्याकरण को शब्दार्थ प्रदान करने का एक माध्यम है और यह एक प्रोग्रामिंग भाषा के वाक्यविन्यास और शब्दार्थ को निर्दिष्ट करने में मदद कर सकता है। व्याकरण की विशेषता (जब एक पार्स-ट्री के रूप में देखा जाता है) एक पेड़ के नोड्स के बीच मूल्यों या जानकारी को पारित कर सकता है।
Example:
E → E + T { E.value = E.value + T.value }
सीएफजी के दाहिने हिस्से में सिमेंटिक नियम शामिल हैं जो निर्दिष्ट करते हैं कि व्याकरण की व्याख्या कैसे की जानी चाहिए। यहां, गैर-टर्मिनलों ई और टी के मूल्यों को एक साथ जोड़ा जाता है और परिणाम को गैर-टर्मिनल ई पर कॉपी किया जाता है।
असाइनमेंट या शर्तों के समय मूल्यांकन और मूल्यांकन के समय अपने डोमेन से अपने मूल्यों को शब्दार्थ विशेषताएँ सौंपी जा सकती हैं। विशेषताओं को उनके मूल्यों को प्राप्त करने के तरीके के आधार पर, उन्हें मोटे तौर पर दो श्रेणियों में विभाजित किया जा सकता है: संश्लेषित विशेषताएँ और विरासत में मिली विशेषताएँ।
संश्लेषित गुण
इन विशेषताओं को उनके बाल नोड्स के गुण मानों से मान मिलता है। वर्णन करने के लिए, निम्नलिखित उत्पादन मानें:
S → ABC
यदि S अपने बच्चे के नोड्स (A, B, C) से मान ले रहा है, तो इसे संश्लेषित विशेषता कहा जाता है, क्योंकि ABC के मान को S से संश्लेषित किया जाता है।
जैसा कि हमारे पिछले उदाहरण (E → E + T) में है, मूल नोड E अपने बच्चे के नोड से इसका मान प्राप्त करता है। सिंथेसाइज्ड विशेषताएँ कभी भी अपने मूल नोड्स या किसी भाई-बहन के नोड्स से मान नहीं लेती हैं।
निहित विशेषताएं
संश्लेषित विशेषताओं के विपरीत, विरासत में मिली विशेषताएँ माता-पिता और / या भाई-बहनों से मान ले सकती हैं। निम्नलिखित उत्पादन में के रूप में,
S → ABC
A, S, B और C. से मान प्राप्त कर सकता है। B, S, A और C से मान ले सकता है। इसी तरह C, S, A और B से मान ले सकता है।
Expansion : जब एक गैर-टर्मिनल को व्याकरणिक नियम के अनुसार टर्मिनलों तक विस्तारित किया जाता है
Reduction: जब व्याकरण के नियमों के अनुसार एक टर्मिनल को उसके संबंधित गैर-टर्मिनल तक घटा दिया जाता है। सिंटेक्स के पेड़ों को ऊपर-नीचे और बाएं से दाएं पर रखा जाता है। जब भी कमी होती है, हम इसके संबंधित शब्दार्थ नियम (क्रिया) लागू करते हैं।
उपर्युक्त कार्यों को करने के लिए शब्दार्थ विश्लेषण Syntax Directed Translations का उपयोग करता है।
सिमेंटिक विश्लेषक अपने पिछले चरण (सिंटैक्स विश्लेषण) से एएसटी (एब्स्ट्रैक्ट सिंटेक्स ट्री) प्राप्त करता है।
सिमेंटिक एनालाइज़र एएसटी के साथ विशेषता जानकारी संलग्न करता है, जिसे एट्रिब्यूटेड एएसटी कहा जाता है।
विशेषताएँ दो टुपल मूल्य हैं, <विशेषता नाम, विशेषता मान>
उदाहरण के लिए:
int value = 5;
<type, “integer”>
<presentvalue, “5”>
हर उत्पादन के लिए, हम एक शब्दार्थ नियम देते हैं।
एस-जिम्मेदार एसडीटी
यदि एक एसडीटी केवल संश्लेषित विशेषताओं का उपयोग करता है, तो इसे एस-अधिकृत एसडीटी कहा जाता है। इन विशेषताओं का मूल्यांकन एस-अधिकृत एसडीटी का उपयोग करके किया जाता है जिसमें उत्पादन (दाएं हाथ की ओर) के बाद उनके सिमेंटिक क्रियाएं लिखी जाती हैं।
जैसा कि ऊपर दर्शाया गया है, एस-एट्रैस्ड एसडीटी में विशेषताओं का मूल्यांकन नीचे-अप पार्सिंग में किया जाता है, क्योंकि मूल नोड्स के मूल्य बच्चे के नोड्स के मूल्यों पर निर्भर करते हैं।
एल-जिम्मेदार एसडीटी
एसडीटी का यह रूप सही भाई-बहनों से मान न लेने के प्रतिबंध के साथ संश्लेषित और विरासत में मिली विशेषताओं दोनों का उपयोग करता है।
एल-एसटीडी एसडीएस में, एक गैर-टर्मिनल अपने माता-पिता, बच्चे और सहोदर नोड्स से मूल्य प्राप्त कर सकता है। जैसा कि निम्नलिखित उत्पादन में है
S → ABC
S, A, B और C (संश्लेषित) से मान ले सकता है। A केवल S से मान ले सकता है। B, S और A से मान ले सकता है। C, S, A और B से मान प्राप्त कर सकता है। कोई गैर-टर्मिनल सिबलिंग से अपने दाईं ओर मान प्राप्त नहीं कर सकता है।
एल-एट्रिब्यूटेड एसडीटी में विशेषताओं का मूल्यांकन गहराई-पहले और बाएं से दाएं पार्सिंग तरीके से किया जाता है।
हम यह निष्कर्ष निकाल सकते हैं कि यदि कोई परिभाषा एस-एट्रिब्यूटेड है, तो यह एल-एट्रिब्यूटेड भी है, क्योंकि एल-एट्रिब्यूटेड परिभाषा एस-एट्रिब्यूटेड परिभाषाओं को घेरती है।