कंपाइलर डिज़ाइन - त्रुटि सुधार
एक पार्सर कार्यक्रम में किसी भी त्रुटि का पता लगाने और रिपोर्ट करने में सक्षम होना चाहिए। यह उम्मीद की जाती है कि जब कोई त्रुटि सामने आती है, तो पार्सर को इसे संभालने में सक्षम होना चाहिए और बाकी इनपुट को पार्स करना चाहिए। अधिकतर यह अपेक्षा होती है कि पार्सर से त्रुटियों की जाँच की जाएगी लेकिन संकलन प्रक्रिया के विभिन्न चरणों में त्रुटियों का सामना किया जा सकता है। एक कार्यक्रम में विभिन्न चरणों में निम्न प्रकार की त्रुटियां हो सकती हैं:
Lexical : गलत तरीके से टाइप किए गए कुछ पहचानकर्ता का नाम
Syntactical : लापता अर्धविराम या असंतुलित कोष्ठक
Semantical : असंगत मूल्य असाइनमेंट
Logical : कोड उपलब्ध नहीं, अनंत लूप
कोड में त्रुटियों से निपटने के लिए चार सामान्य त्रुटि-पुनर्प्राप्ति रणनीतियाँ हैं जिन्हें पार्सर में लागू किया जा सकता है।
पैनिक मोड
जब एक पार्सर बयान में कहीं भी एक त्रुटि का सामना करता है, तो यह गलत इनपुट से लेकर सीमांकक जैसे अर्ध-बृहदान्त्र तक इनपुट को संसाधित नहीं करके शेष विवरण को अनदेखा करता है। यह त्रुटि-पुनर्प्राप्ति का सबसे आसान तरीका है और इसके अलावा, यह पार्सर को अनंत छोरों को विकसित करने से रोकता है।
स्टेटमेंट मोड
जब एक पार्सर एक त्रुटि का सामना करता है, तो यह सुधारात्मक उपाय करने की कोशिश करता है ताकि बयान के बाकी इनपुट पार्सर को आगे पार्स करने की अनुमति दें। उदाहरण के लिए, एक लापता अर्धविराम सम्मिलित करना, अर्धविराम आदि के साथ अल्पविराम को प्रतिस्थापित करना। पार्सर डिजाइनरों को यहां सावधान रहना होगा क्योंकि एक गलत सुधार से अनंत लूप हो सकता है।
त्रुटि प्रोडक्शंस
कुछ सामान्य त्रुटियाँ कंपाइलर डिजाइनरों के लिए जानी जाती हैं जो कोड में हो सकती हैं। इसके अलावा, डिजाइनर उपयोग किए जाने के लिए संवर्धित व्याकरण बना सकते हैं, क्योंकि इन त्रुटियों का सामना करने पर गलत निर्माण उत्पन्न करने वाले प्रोडक्शंस।
वैश्विक सुधार
पार्सर कार्यक्रम को पूरी तरह से हाथ में मानता है और यह पता लगाने की कोशिश करता है कि कार्यक्रम क्या करने का इरादा है और इसके लिए एक निकटतम मैच का पता लगाने की कोशिश करता है, जो त्रुटि रहित है। जब एक गलत इनपुट (स्टेटमेंट) X को फीड किया जाता है, तो यह कुछ निकटतम त्रुटि-मुक्त स्टेटमेंट Y के लिए एक पार्स ट्री बनाता है। इससे पार्सर को सोर्स कोड में न्यूनतम परिवर्तन करने की अनुमति मिल सकती है, लेकिन जटिलता (समय और स्थान) के कारण यह रणनीति, इसे अभी तक लागू नहीं किया गया है।
सार सिंटेक्स ट्री
पार्स ट्री अभ्यावेदन को संकलक द्वारा पार्स किया जाना आसान नहीं है, क्योंकि उनमें वास्तव में आवश्यकता से अधिक विवरण होते हैं। एक उदाहरण के रूप में निम्नलिखित पार्स ट्री लें:
अगर बारीकी से देखा जाए, तो हम पाते हैं कि ज्यादातर पत्ता नोड्स अपने माता-पिता के लिए एकल बच्चे हैं। अगले चरण में खिलाने से पहले इस जानकारी को समाप्त किया जा सकता है। अतिरिक्त जानकारी छिपाकर, हम नीचे दिखाए गए अनुसार एक पेड़ प्राप्त कर सकते हैं:
सार पेड़ का प्रतिनिधित्व किया जा सकता है:
एएसटी एक संकलक में महत्वपूर्ण डेटा संरचनाएं हैं जिनमें कम से कम अनावश्यक जानकारी होती है। एएसटी एक पार्स पेड़ की तुलना में अधिक कॉम्पैक्ट हैं और एक संकलक द्वारा आसानी से उपयोग किया जा सकता है।