कंपाइलर डिज़ाइन - प्रतीक तालिका

प्रतीक तालिका एक महत्वपूर्ण डेटा संरचना है जिसे कंपाइलरों द्वारा विभिन्न संस्थाओं जैसे कि परिवर्तनशील नामों, फ़ंक्शन नामों, ऑब्जेक्ट्स, क्लासेस, इंटरफ़ेस आदि के बारे में जानकारी संग्रहीत करने के लिए बनाया और बनाए रखा जाता है। सिंबल टेबल का उपयोग विश्लेषण और संश्लेषण दोनों द्वारा किया जाता है। एक संकलक के कुछ हिस्सों।

एक प्रतीक तालिका हाथ में भाषा के आधार पर निम्नलिखित उद्देश्यों की पूर्ति कर सकती है:

  • एक स्थान पर संरचित रूप में सभी संस्थाओं के नाम संग्रहीत करने के लिए।

  • यह सत्यापित करने के लिए कि क्या एक चर घोषित किया गया है।

  • स्रोत कोड में असाइनमेंट और अभिव्यक्तियों को सत्यापित करके टाइप चेकिंग को लागू करना, शब्दार्थ रूप से सही हैं।

  • एक नाम (गुंजाइश संकल्प) के दायरे का निर्धारण करने के लिए।

एक प्रतीक तालिका बस एक तालिका है जो या तो रैखिक या एक हैश तालिका हो सकती है। यह निम्नलिखित प्रारूप में प्रत्येक नाम के लिए एक प्रविष्टि रखता है:

<symbol name,  type,  attribute>

उदाहरण के लिए, यदि एक प्रतीक तालिका में निम्नलिखित चर घोषणा के बारे में जानकारी संग्रहीत की जानी है:

static int interest;

फिर उसे प्रविष्टि को इस तरह संग्रहित करना चाहिए:

<interest, int, static>

विशेषता खंड में नाम से संबंधित प्रविष्टियाँ हैं।

कार्यान्वयन

यदि एक संकलक को डेटा की एक छोटी मात्रा को संभालना है, तो प्रतीक तालिका को एक अनियंत्रित सूची के रूप में लागू किया जा सकता है, जिसे कोड करना आसान है, लेकिन यह केवल छोटी तालिकाओं के लिए ही उपयुक्त है। एक प्रतीक तालिका निम्नलिखित तरीकों में से एक में लागू की जा सकती है:

  • रेखीय (क्रमबद्ध या अनसुलझा) सूची
  • बाइनरी सर्च ट्री
  • हैश टेबल

इन सबके बीच, प्रतीक तालिका को ज्यादातर हैश टेबल के रूप में लागू किया जाता है, जहां स्रोत कोड प्रतीक को हैश फ़ंक्शन के लिए एक कुंजी के रूप में माना जाता है और वापसी मूल्य प्रतीक के बारे में जानकारी है।

संचालन

एक प्रतीक तालिका, या तो रैखिक या हैश, निम्नलिखित संचालन प्रदान करना चाहिए।

डालने ()

यह ऑपरेशन विश्लेषण चरण द्वारा अधिक बार उपयोग किया जाता है, अर्थात, कंपाइलर की पहली छमाही जहां टोकन की पहचान की जाती है और तालिका में नाम संग्रहीत किए जाते हैं। इस ऑपरेशन का उपयोग प्रतीक तालिका में स्रोत कोड में होने वाले अद्वितीय नामों के बारे में जानकारी जोड़ने के लिए किया जाता है। प्रारूप या संरचना जिसमें नाम संग्रहीत हैं, हाथ में संकलक पर निर्भर करता है।

स्रोत कोड में प्रतीक के लिए एक विशेषता उस प्रतीक से जुड़ी जानकारी है। इस जानकारी में प्रतीक के बारे में मूल्य, स्थिति, क्षेत्र और प्रकार शामिल हैं। सम्मिलित () फ़ंक्शन प्रतीक और उसकी विशेषताओं को तर्क के रूप में लेता है और सूचना तालिका में संग्रहीत करता है।

उदाहरण के लिए:

int a;

संकलक द्वारा संसाधित किया जाना चाहिए:

insert(a, int);

देखो()

लुकअप () ऑपरेशन का उपयोग यह निर्धारित करने के लिए प्रतीक तालिका में नाम खोजने के लिए किया जाता है:

  • यदि प्रतीक तालिका में मौजूद है।
  • अगर इसका इस्तेमाल होने से पहले घोषित किया जाता है।
  • यदि नाम को दायरे में उपयोग किया जाता है।
  • यदि प्रतीक आरम्भिक है।
  • यदि प्रतीक कई बार घोषित हुआ।

लुकअप भाषा के अनुसार लुकअप () फ़ंक्शन का प्रारूप बदलता रहता है। मूल प्रारूप निम्नलिखित से मेल खाना चाहिए:

lookup(symbol)

यदि प्रतीक तालिका में प्रतीक मौजूद नहीं है, तो यह विधि 0 (शून्य) देता है। यदि प्रतीक प्रतीक तालिका में मौजूद है, तो यह तालिका में संग्रहीत अपनी विशेषताओं को लौटाता है।

स्कोप प्रबंधन

एक कंपाइलर दो प्रकार के प्रतीक तालिकाओं को बनाए रखता है: ए global symbol table जिसे सभी प्रक्रियाओं द्वारा पहुँचा जा सकता है और scope symbol tables जो कि कार्यक्रम में प्रत्येक क्षेत्र के लिए बनाए गए हैं।

एक नाम का दायरा निर्धारित करने के लिए, प्रतीक सारणी को पदानुक्रमित संरचना में व्यवस्थित किया गया है जैसा कि नीचे दिए गए उदाहरण में दिखाया गया है:

. . . 
int value=10;

void pro_one()
   {
   int one_1;
   int one_2;
   
      {              \
      int one_3;      |_  inner scope 1 
      int one_4;      | 
      }              /
      
   int one_5; 
   
      {              \   
      int one_6;      |_  inner scope 2
      int one_7;      |
      }              /
   }
   
void pro_two()
   {
   int two_1;
   int two_2;
   
      {              \
      int two_3;      |_  inner scope 3
      int two_4;      |
      }              /
      
   int two_5;
   }
. . .

उपरोक्त कार्यक्रम को प्रतीक तालिकाओं की एक श्रेणीबद्ध संरचना में दर्शाया जा सकता है:

वैश्विक प्रतीक तालिका में एक वैश्विक चर (इंट वैल्यू) और दो प्रक्रिया नाम के नाम हैं, जो ऊपर दिखाए गए सभी बच्चे नोड्स के लिए उपलब्ध होना चाहिए। Pro_one प्रतीक तालिका (और उसके सभी बच्चे टेबल) में वर्णित नाम pro_two प्रतीकों और उसके बच्चे की तालिकाओं के लिए उपलब्ध नहीं हैं।

यह प्रतीक तालिका डेटा संरचना पदानुक्रम सिमेंटिक विश्लेषक में संग्रहीत होती है और जब भी किसी नाम को प्रतीक तालिका में खोजने की आवश्यकता होती है, तो इसे निम्नलिखित एल्गोरिथ्म का उपयोग करके खोजा जाता है:

  • पहले एक प्रतीक को वर्तमान क्षेत्र में खोजा जाएगा, अर्थात वर्तमान प्रतीक तालिका।

  • यदि कोई नाम मिल जाता है, तो खोज पूरी हो जाती है, अन्यथा इसे माता-पिता के प्रतीक तालिका में खोजा जाएगा,

  • या तो नाम मिला है या नाम के लिए वैश्विक प्रतीक तालिका खोजी गई है।