तोता - त्वरित गाइड

जब हम अपने कार्यक्रम को पारंपरिक पर्ल में खिलाते हैं, तो इसे पहले एक आंतरिक प्रतिनिधित्व, या बायटेकोड में संकलित किया जाता है; इस बाइटकोड को तब पर्ल के अंदर लगभग अलग-अलग उपप्रणाली में खिलाया जाता है। तो पर्ल के संचालन के दो अलग-अलग चरण हैं:

  • बाइटकोड और के लिए संकलन

  • बाइटकोड की व्याख्या।

यह पर्ल के लिए अद्वितीय नहीं है। इस डिजाइन का अनुसरण करने वाली अन्य भाषाओं में पायथन, रूबी, टीएलसी और यहां तक ​​कि जावा भी शामिल हैं।

हम यह भी जानते हैं कि एक जावा वर्चुअल मशीन (JVM) है जो एक प्लेटफ़ॉर्म स्वतंत्र निष्पादन वातावरण है जो जावा बाइटकोड को मशीन की भाषा में परिवर्तित करता है और इसे निष्पादित करता है। यदि आप इस अवधारणा को समझते हैं तो आप तोते को समझ पाएंगे।

Parrotएक आभासी मशीन है जिसे व्याख्यायित भाषाओं के लिए कुशलतापूर्वक संकलित और निष्पादित करने के लिए डिज़ाइन किया गया है। तोता अंतिम पर्ल 6 संकलक के लिए लक्ष्य है, और इसका उपयोग पग के लिए एक बैकेंड के रूप में किया जाता है, साथ ही साथ अन्य भाषाओं जैसे Tcl, रूबी, पायथन आदि के लिए भी उपयोग किया जाता है।

तोता सबसे लोकप्रिय भाषा "सी" का उपयोग करते हुए लिखा गया है।

शुरू करने से पहले, हम तोते की एक नवीनतम प्रति डाउनलोड करते हैं और इसे हमारी मशीन पर स्थापित करते हैं।

तोता डाउनलोड लिंक तोता CVS स्नैपशॉट में उपलब्ध है । तोता का नवीनतम संस्करण डाउनलोड करें और इसे स्थापित करने के लिए निम्न चरणों का पालन करें:

  • डाउनलोड की गई फ़ाइल को खोलना और खोलना।

  • सुनिश्चित करें कि आपके पास पहले से ही पर्ल 5 आपके मशीन पर स्थापित है।

  • अब निम्नलिखित करें:

% cd parrot
% perl Configure.pl
Parrot Configure
Copyright (C) 2001 Yet Another Society
Since you're running this script, you obviously have
Perl 5 -- I'll be pulling some defaults from its configuration.
...
  • फिर आपको अपने स्थानीय कॉन्फ़िगरेशन के बारे में कई प्रश्न पूछे जाएंगे; आप लगभग हमेशा हिट रिटर्न / हर एक के लिए प्रवेश कर सकते हैं।

  • अंत में, आपको टाइप किया जाएगा - test_prog बनाएं, और तोता सफलतापूर्वक परीक्षण दुभाषिया का निर्माण करेगा।

  • अब आपको कुछ परीक्षण चलाने चाहिए; इसलिए टाइप करें 'टेस्ट' और आपको निम्न की तरह एक रीडआउट देखना चाहिए:

perl t/harness
t/op/basic.....ok,1/2 skipped:label constants unimplemented in
assembler
t/op/string....ok, 1/4 skipped:  I'm unable to write it!
All tests successful, 2 subtests skipped.
Files=2, Tests=6,......

जब तक आप इसे पढ़ते हैं, तब तक अधिक परीक्षण हो सकते हैं, और उनमें से कुछ जो स्किप हो गए थे, उन्हें छोड़ नहीं सकते, लेकिन सुनिश्चित करें कि उनमें से कोई भी असफल नहीं होना चाहिए!

एक बार जब आप एक तोता निष्पादन योग्य स्थापित किया है, तो आप में दिये गये उदाहरण के विभिन्न प्रकार की जांच कर सकते तोता 'उदाहरण' अनुभाग। इसके अलावा आप तोता भंडार में उदाहरण निर्देशिका की जांच कर सकते हैं।

तोता वर्तमान में चार रूपों में निष्पादित करने के निर्देश स्वीकार कर सकता है। पीआईआर (तोता मध्यवर्ती प्रतिनिधि) को लोगों द्वारा लिखा और कंपाइलरों द्वारा उत्पन्न किया गया है। यह कुछ निम्न-स्तरीय विवरणों को छिपा देता है, जैसे कि पैरामीटर को फ़ंक्शन के लिए पारित किया जाता है।

पीएएसएम (तोता विधानसभा) पीआईआर से नीचे का स्तर है - यह अभी भी मानव पठनीय / लेखन योग्य है और एक संकलक द्वारा उत्पन्न किया जा सकता है, लेकिन लेखक को कॉलिंग सम्मेलनों और पंजीकरण आवंटन जैसे विवरणों का ध्यान रखना होगा। PAST (तोता सार सिंटेक्स ट्री) तोता को एक सार वाक्यविन्यास ट्री शैली इनपुट को स्वीकार करने में सक्षम बनाता है - जो लिखने वालों के लिए उपयोगी है।

उपरोक्त सभी प्रकार के इनपुट स्वचालित रूप से तोते के अंदर PBC (तोता बाइटकोड) में परिवर्तित हो जाते हैं। यह मशीन कोड की तरह है, लेकिन तोता दुभाषिया द्वारा समझा जाता है।

यह मानव-पठनीय या मानव-योग्य होने का इरादा नहीं है, लेकिन अन्य रूपों के विपरीत निष्पादन एक विधानसभा चरण की आवश्यकता के बिना तुरंत शुरू हो सकता है। तोता बाइटकोड मंच स्वतंत्र है।

निर्देश सेट

तोता निर्देश सेट में अंकगणित और तार्किक ऑपरेटर शामिल हैं, तुलना और शाखा / कूद (छोरों को लागू करने के लिए, यदि ... तो निर्माण आदि), कक्षाओं और ऑब्जेक्ट्स के साथ काम करते हुए, सबरूटीन्स और तरीकों को कॉल करते हुए, ग्लोबल और लेक्सिकल वेरिएबल्स को ढूंढना और संग्रहीत करना। उनके मापदंडों के साथ, I / O, थ्रेड और बहुत कुछ।

जावा वर्चुअल मशीन की तरह, तोता भी आपको स्मृति डी-आवंटन की चिंता से मुक्त रखता है।

  • तोता कचरा संग्रह प्रदान करता है।

  • तोता कार्यक्रमों को स्पष्ट रूप से स्मृति मुक्त करने की आवश्यकता नहीं है।

  • आवंटित स्मृति को मुक्त कर दिया जाएगा जब यह अब उपयोग में नहीं है अर्थात अब संदर्भित नहीं है।

  • तोता कचरा कलेक्टर अवांछित स्मृति का ख्याल रखने के लिए समय-समय पर चलाता है।

तोता सीपीयू में चार बुनियादी डेटा प्रकार हैं:

  • IV

    पूर्णांक प्रकार; सूचक रखने के लिए पर्याप्त विस्तृत होने की गारंटी।

  • NV

    एक वास्तुकला-स्वतंत्र फ्लोटिंग-पॉइंट प्रकार।

  • STRING

    एक सार, एन्कोडिंग-स्वतंत्र स्ट्रिंग प्रकार।

  • PMC

    एक अदिश राशि।

पहले तीन प्रकार बहुत अधिक आत्म-व्याख्यात्मक हैं; अंतिम प्रकार - तोता जादू कुकीज़, समझने के लिए थोड़ा अधिक कठिन हैं।

पीएमसी क्या हैं?

PMC का मतलब तोता मैजिक कुकी है। पीएमसी किसी भी जटिल डेटा संरचना या प्रकार का प्रतिनिधित्व करते हैं, जिसमें कुल डेटा प्रकार (सरणियाँ, हैश टेबल आदि) शामिल हैं। एक पीएमसी इस पर किए गए अंकगणित, तार्किक और स्ट्रिंग संचालन के लिए अपने स्वयं के व्यवहार को लागू कर सकता है, जिससे भाषा-विशिष्ट व्यवहार पेश किया जा सकता है। पीएमसी को तोते को निष्पादन योग्य या गतिशील रूप से लोड किया जा सकता है जब उन्हें ज़रूरत होती है।

वर्तमान पर्ल 5 वर्चुअल मशीन एक स्टैक मशीन है। यह उन्हें स्टैक पर रखकर संचालन के बीच मूल्यों का संचार करता है। स्टैक पर संचालन मानों को लोड करने के लिए उन्हें जो कुछ भी करने की आवश्यकता होती है उसे करें और परिणाम को स्टैक पर वापस रखें। इसके साथ काम करना आसान है, लेकिन यह धीमा है।

दो संख्याओं को एक साथ जोड़ने के लिए, आपको तीन स्टैक पुश और दो स्टैक पॉप करने की आवश्यकता है। इससे भी बदतर, स्टैक को रनटाइम पर बढ़ना है, और इसका मतलब है कि स्मृति को आवंटित करना जब आप इसे आवंटित नहीं करना चाहते हैं।

तो तोता आभासी मशीनों के लिए स्थापित परंपरा को तोड़ने जा रहा है, और एक रजिस्टर आर्किटेक्चर का उपयोग करता है, एक वास्तविक हार्डवेयर सीपीयू की वास्तुकला के लिए अधिक समान है। इसका एक और फायदा है। हम अपने सॉफ्टवेयर CPU के लिए रजिस्टर-आधारित CPU के लिए कंपाइलर और ऑप्टिमाइज़र लिखने के लिए सभी मौजूदा साहित्य का उपयोग कर सकते हैं!

तोते के प्रत्येक प्रकार के लिए विशेषज्ञ रजिस्टर होते हैं: 32 IV रजिस्टर, 32 एनवी रजिस्टर, 32 स्ट्रिंग रजिस्टर और 32 पीएमसी रजिस्टर। तोता असेंबलर में, इनका नाम क्रमशः I1 ... I32, N1 ... N32, S1 ... S32, P1 ... 3: 32 है।

अब आइए कुछ असेंबलर को देखें। हम इन रजिस्टरों को सेट ऑपरेटर के साथ सेट कर सकते हैं:

set I1, 10
	set N1, 3.1415
	set S1, "Hello, Parrot"

सभी तोता ऑप्स का एक ही प्रारूप है: ऑपरेटर का नाम, गंतव्य रजिस्टर और फिर ऑपरेंड।

आपके द्वारा किए जाने वाले कई प्रकार के ऑपरेशन हैं। उदाहरण के लिए, हम एक रजिस्टर या एक स्थिर सामग्री को प्रिंट कर सकते हैं:

set I1, 10
print "The contents of register I1 is: "
print I1
print "\n"

उपरोक्त निर्देशों के परिणामस्वरूप रजिस्टर I1 की सामग्री है: 10

हम रजिस्टरों पर गणितीय कार्य कर सकते हैं:

# Add the contents of I2 to the contents of I1
add I1, I1, I2
# Multiply I2 by I4 and store in I3
mul I3, I2, I4
# Increment I1 by one
inc I1
# Decrement N3 by 1.5
dec N3, 1.5

हम कुछ सरल स्ट्रिंग हेरफेर भी कर सकते हैं:

set S1, "fish"
set S2, "bone"
concat S1, S2       # S1 is now "fishbone"
set S3, "w"
substr S4, S1, 1, 7
concat S3, S4       # S3 is now "wishbone"
length I1, S3       # I1 is now 8

प्रवाह नियंत्रण के बिना कोड थोड़ा उबाऊ हो जाता है; शुरुआत के लिए, तोता शाखा और लेबल के बारे में जानता है। शाखा ऑप पर्ल के गोटो के बराबर है:

branch TERRY
JOHN:    print "fjords\n"
         branch END
MICHAEL: print " pining"
         branch GRAHAM
TERRY:   print "It's"
         branch MICHAEL
GRAHAM:  print " for the "
         branch JOHN
END:     end

यह देखने के लिए सरल परीक्षण भी कर सकते हैं कि क्या एक रजिस्टर में एक सही मूल्य है:

set I1, 12
         set I2, 5
         mod I3, I2, I2
         if I3, REMAIND, DIVISOR
REMAIND: print "5 divides 12 with remainder "
         print I3
         branch DONE
DIVISOR: print "5 is an integer divisor of 12"
DONE:    print "\n"
         end

तुलना के लिए यहां पर्ल में क्या दिखेगा:

$i1 = 12;
    $i2 = 5;
    $i3 = $i1 % $i2;
    if ($i3) {
      print "5 divides 12 with remainder ";
      print $i3;
    } else {
      print "5 is an integer divisor of 12";
    }
    print "\n";
    exit;

तोता संचालक

हमारे पास संख्यात्मक तुलनाकर्ताओं की पूरी श्रृंखला है: eq, ne, lt, gt, le और ge। ध्यान दें कि आप इन ऑपरेटरों को असमान प्रकार के तर्कों पर उपयोग नहीं कर सकते हैं; आपको ऑपिक्स _i या _n को ऑप से जोड़ने की भी आवश्यकता हो सकती है, यह बताने के लिए कि आप किस प्रकार के तर्क का उपयोग कर रहे हैं, हालाँकि असेंबलर को आपके लिए यह परमात्मा चाहिए, जब तक आप इसे पढ़ नहीं लेते।

तोता प्रोग्रामिंग विधानसभा भाषा प्रोग्रामिंग के समान है और आपको निचले स्तर पर काम करने का मौका मिलता है। यहाँ प्रोग्रामिंग उदाहरणों की सूची है जो आपको तोता प्रोग्रामिंग के विभिन्न पहलुओं से अवगत कराती है।

  • क्लासिक हैलो दुनिया!
  • रजिस्टरों का उपयोग करना
  • चौकों का योग
  • फाइबोनैचि संख्या
  • कम्प्यूटिंग फैक्टरियल
  • पीबीसी के लिए संकलन
  • पीर बनाम पीएएसएम

क्लासिक हैलो दुनिया!

एक फाइल बनाएं जिसका नाम है hello.pir जिसमें निम्नलिखित कोड हो:

.sub _main
      print "Hello world!\n"
      end
  .end

फिर इसे टाइप करके चलाएं:

parrot hello.pir

जैसी कि उम्मीद थी, यह पाठ 'हैलो वर्ल्ड!' कंसोल पर, उसके बाद एक नई लाइन (\ n) के कारण।

इस उपरोक्त उदाहरण में, '.sub _main' में कहा गया है कि पालन करने वाले निर्देश '_main' नामक एक सबरूटीन बनाते हैं, जब तक कि '.end' का सामना नहीं किया जाता। दूसरी पंक्ति में प्रिंट निर्देश है। इस मामले में, हम उस निर्देश के संस्करण को बुला रहे हैं जो एक निरंतर स्ट्रिंग को स्वीकार करता है। कोडांतरक यह तय करने का ध्यान रखता है कि हमारे लिए किस संस्करण का उपयोग किया जाए। तीसरी पंक्ति में 'अंत' निर्देश है, जो दुभाषिया को समाप्त करने का कारण बनता है।

रजिस्टरों का उपयोग करना

हम hello.pir को पहले स्ट्रिंग हैलो वर्ल्ड को स्टोर करने के लिए संशोधित कर सकते हैं! \ N एक रजिस्टर में और फिर प्रिंट निर्देश के साथ उस रजिस्टर का उपयोग करें।

.sub _main
      set S1, "Hello world!\n"
      print S1
      end
  .end

यहाँ हमने बताया है कि कौन से रजिस्टर का उपयोग करना है। हालांकि, $ S1 के साथ S1 को बदलकर हम तोते को उपयोग करने के लिए किस रजिस्टर का चुनाव कर सकते हैं। सेट निर्देश लिखने के बजाय = नोटेशन का उपयोग करना भी संभव है।

.sub _main
      $S0 = "Hello world!\n"
      print $S0
      end
  .end

पीआईआर को और भी पठनीय बनाने के लिए, नामित रजिस्टरों का उपयोग किया जा सकता है। बाद में इन्हें वास्तविक संख्या वाले रजिस्टरों में मैप किया जाता है।

.sub _main
      .local string hello
      hello = "Hello world!\n"
      print hello
      end
  .end

'.Local' निर्देश बताता है कि नामांकित रजिस्टर को केवल वर्तमान संकलन इकाई (यानी ,ssub और .end) के अंदर की आवश्यकता है। निम्नलिखित '.लोकल' एक प्रकार है। यह int (I रजिस्टर के लिए), फ्लोट (N रजिस्टर के लिए), स्ट्रिंग (S रजिस्टर के लिए), pmc (P रजिस्टर के लिए) या एक PMC प्रकार का नाम हो सकता है।

चौकों का योग

यह उदाहरण कुछ और निर्देशों और पीआईआर सिंटैक्स का परिचय देता है। # के साथ शुरू होने वाली लाइनें टिप्पणियां हैं।

.sub _main
      # State the number of squares to sum.
      .local int maxnum
      maxnum = 10

      # Some named registers we'll use. 
      # Note how we can declare many
      # registers of the same type on one line.
      .local int i, total, temp
      total = 0

      # Loop to do the sum.
      i = 1
  loop:
      temp = i * i
      total += temp
      inc i
      if i <= maxnum goto loop

      # Output result.
      print "The sum of the first "
      print maxnum
      print " squares is "
      print total
      print ".\n"
      end
  .end

पीआईआर थोड़ा सा संश्लिष्ट शर्करा प्रदान करता है जो इसे विधानसभा की तुलना में अधिक उच्च स्तर का बनाता है। उदाहरण के लिए:

temp = i * i

अधिक विधानसभा-ईश लिखने का एक और तरीका है:

mul temp, i, i

तथा:

if i <= maxnum goto loop

के समान है:

le i, maxnum, loop

तथा:

total += temp

के समान है:

add total, temp

एक नियम के रूप में, जब भी एक तोता निर्देश एक रजिस्टर की सामग्री को संशोधित करता है, तो विधानसभा प्रपत्र में निर्देश लिखते समय यह पहला रजिस्टर होगा।

जैसा कि विधानसभा भाषाओं में सामान्य है, लूप और चयन सशर्त शाखा के बयानों और लेबल के संदर्भ में कार्यान्वित किए जाते हैं, जैसा कि ऊपर दिखाया गया है। असेंबली प्रोग्रामिंग एक जगह है जहाँ गोटो का उपयोग करना एक बुरा रूप नहीं है!

फाइबोनैचि संख्या

फाइबोनैचि श्रृंखला को इस तरह परिभाषित किया गया है: दो संख्याओं, 1 और 1. को ले लीजिए और फिर श्रृंखला में अंतिम दो संख्याओं को जोड़कर अगले एक को बनाएं: 1, 1, 2, 3, 5, 8, 13, और इसी तरह । फाइबोनैचि संख्या फ़ाइब (n) श्रृंखला में n'th संख्या है। यहाँ एक साधारण तोता असेंबलर प्रोग्राम है जो पहले 20 फाइबोनैचि संख्याओं का पता लगाता है:

# Some simple code to print some Fibonacci numbers

        print   "The first 20 fibonacci numbers are:\n"
        set     I1, 0
        set     I2, 20
        set     I3, 1
        set     I4, 1
REDO:   eq      I1, I2, DONE, NEXT
NEXT:   set     I5, I4
        add     I4, I3, I4
        set     I3, I5
        print   I3
        print   "\n"
        inc     I1
        branch  REDO
DONE:   end

यह पर्ल में बराबर कोड है:

print "The first 20 fibonacci numbers are:\n";
        my $i = 0;
        my $target = 20;
        my $a = 1;
        my $b = 1;
        until ($i == $target) {
           my $num = $b;
           $b += $a;
           $a = $num;
           print $a,"\n";
           $i++;
        }

NOTE:ब्याज के एक ठीक बिंदु के रूप में, पर्ल में एक फाइबोनैचि श्रृंखला को प्रिंट करने का सबसे छोटा और निश्चित रूप से सबसे सुंदर तरीका perl -le '$ b = 1 है; $ b + = $ b को प्रिंट करें जबकि $ b + = $ a को प्रिंट करें।

पुनरावर्ती कंप्यूटिंग तथ्य

इस उदाहरण में हम एक फैक्टरियल फ़ंक्शन को परिभाषित करते हैं और फैक्टरियल की गणना करने के लिए इसे पुनरावर्ती कहते हैं।

.sub _fact
      # Get input parameter.
      .param int n

      # return (n > 1 ? n * _fact(n - 1) : 1)
      .local int result

      if n > 1 goto recurse
      result = 1
      goto return

  recurse:
      $I0 = n - 1
      result = _fact($I0)
      result *= n

  return:
      .return (result)
  .end


  .sub _main :main
      .local int f, i

      # We'll do factorial 0 to 10.
      i = 0
  loop:
      f = _fact(i)

      print "Factorial of "
      print i
      print " is "
      print f
      print ".\n"

      inc i
      if i <= 10 goto loop

      # That's it.
      end
  .end

आइए पहले _fact उप को देखें। एक बिंदु जो पहले खत्म हो गया था, इसलिए सबरूटीन्स के नाम, सभी एक अंडरस्कोर के साथ शुरू होते हैं! यह केवल यह दिखाने के तरीके के रूप में किया जाता है कि लेबल एक विशेष उप-स्काउट के लिए वैश्विक होने के बजाय वैश्विक है। यह महत्वपूर्ण है क्योंकि लेबल तब अन्य सबरूटीन्स को दिखाई देता है।

पहली पंक्ति, .param int n, निर्दिष्ट करती है कि यह सबरूटीन एक पूर्णांक पैरामीटर लेता है और हम उस रजिस्टर को संदर्भित करना चाहते हैं जिसे बाकी सब के लिए n n नाम से पारित किया गया था।

निम्न में से बहुत से पिछले उदाहरणों में देखे गए हैं, लाइन पढ़ने के अलावा:

result = _fact($I0)

PIR की यह एकल रेखा वास्तव में PASM की कुछ पंक्तियों का प्रतिनिधित्व करती है। सबसे पहले, रजिस्टर $ I0 में मूल्य _fact फ़ंक्शन द्वारा पूर्णांक पैरामीटर के रूप में प्राप्त करने के लिए उपयुक्त रजिस्टर में ले जाया जाता है। अन्य कॉलिंग संबंधित रजिस्टरों को तब सेट किया जाता है, उसके बाद _fact को आमंत्रित किया जाता है। फिर, एक बार _fact रिटर्न होने पर, _fact द्वारा लौटाए गए मान को नाम परिणाम दिए गए रजिस्टर में रखा जाता है।

_Fact उप के .end से ठीक पहले, एक .return निर्देश का उपयोग रजिस्टर में रखे गए मूल्य को सुनिश्चित करने के लिए किया जाता है; नाम परिणाम को सही रजिस्टर में रखा गया है, इसे उप कॉलिंग कोड द्वारा रिटर्न वैल्यू के रूप में देखा जा सकता है।

मुख्य रूप से _fact को कॉल उसी तरह से काम करता है, जिस तरह से _fact को sub _fact में ही कॉल किया जाता है। नए सिंटैक्स का एकमात्र शेष बिट है: मुख्य, जिसे .sub _main के बाद लिखा गया है। डिफ़ॉल्ट रूप से, पीआईआर मानता है कि निष्पादन फ़ाइल में पहले उप के साथ शुरू होता है। उप में शुरू करने के लिए उप को चिह्नित करके इस व्यवहार को बदला जा सकता है: मुख्य।

पीबीसी के लिए संकलन

PIR को बाइटकोड में संकलित करने के लिए, -o ध्वज का उपयोग करें और एक्सटेंशन के साथ आउटपुट फ़ाइल निर्दिष्ट करें। पीपीबीसी।

parrot -o factorial.pbc factorial.pir

पीर बनाम पीएएसएम

PIR को चालू करके PASM में बदला जा सकता है:

parrot -o hello.pasm hello.pir

अंतिम उदाहरण के लिए PASM इस तरह दिखता है:

_main:
      set S30, "Hello world!\n"
      print S30
      end

PASM रजिस्टर आवंटन को संभालता नहीं है या नामित रजिस्टरों के लिए सहायता प्रदान करता है। इसमें निर्देश के प्रारंभ में लेबल के साथ प्रतिस्थापित करने के बजाय .sub और .end निर्देश भी नहीं हैं।