जावा वर्चुअल मशीन - जेआईटी कंपाइलर

इस अध्याय में, हम JIT संकलक और संकलित और व्याख्या की गई भाषाओं के बीच अंतर के बारे में जानेंगे।

संकलित बनाम व्याख्या की गई भाषाएँ

C, C ++ और FORTRAN जैसी भाषाएँ संकलित भाषाएँ हैं। उनके कोड को अंतर्निहित मशीन पर लक्षित बाइनरी कोड के रूप में दिया जाता है। इसका मतलब यह है कि उच्च-स्तरीय कोड को एक बार एक स्थिर संकलक द्वारा द्विआधारी कोड में संकलित किया गया है जो विशेष रूप से अंतर्निहित वास्तुकला के लिए लिखा गया है। जो बाइनरी उत्पन्न होती है वह किसी अन्य आर्किटेक्चर पर नहीं चलेगी।

दूसरी ओर, पायथन और पर्ल जैसी व्याख्या की गई भाषाएं किसी भी मशीन पर चल सकती हैं, जब तक कि उनके पास एक वैध दुभाषिया हो। यह उच्च-स्तरीय कोड पर लाइन-बाय-लाइन पर जाता है, जो कि बाइनरी कोड में परिवर्तित होता है।

संकलित कोड आमतौर पर संकलित कोड की तुलना में धीमा है। उदाहरण के लिए, एक लूप पर विचार करें। एक व्याख्या लूप के प्रत्येक पुनरावृत्ति के लिए संबंधित कोड को रूपांतरित करेगा। दूसरी ओर, एक संकलित कोड अनुवाद को केवल एक बना देगा। इसके अलावा, चूँकि व्याख्याकार एक समय में केवल एक ही लाइन देखते हैं, इसलिए वे किसी भी महत्वपूर्ण कोड को निष्पादित करने में असमर्थ होते हैं जैसे कि, संकलक जैसे कथनों के निष्पादन के क्रम को बदलना।

हम नीचे इस तरह के अनुकूलन का एक उदाहरण देखेंगे -

Adding two numbers stored in memory। चूँकि मेमोरी एक्सेस करने से कई सीपीयू साइकल का उपभोग किया जा सकता है, एक अच्छा कंपाइलर डेटा को मेमोरी से लाने के लिए निर्देश जारी करेगा और डेटा के उपलब्ध होने पर ही अतिरिक्त क्रियान्वित करेगा। यह इंतजार नहीं करेगा और इस बीच, अन्य निर्देशों को निष्पादित करें। दूसरी ओर, व्याख्या के दौरान ऐसा कोई अनुकूलन संभव नहीं होगा क्योंकि दुभाषिया किसी भी समय पूरे कोड के बारे में नहीं जानता है।

लेकिन फिर, व्याख्या की गई भाषाएं किसी भी मशीन पर चल सकती हैं, जिसमें उस भाषा का एक वैध दुभाषिया होता है।

जावा संकलित या व्याख्या की गई है?

जावा ने बीच का रास्ता खोजने की कोशिश की। चूंकि जेवीएम जेवैक कंपाइलर और अंतर्निहित हार्डवेयर के बीच बैठता है, जेवैक (या कोई अन्य कंपाइलर) कंपाइलर बाइटकोड में जावा कोड को संकलित करता है, जिसे एक प्लेटफॉर्म विशिष्ट जेवीएम द्वारा समझा जाता है। JVM कोड को निष्पादित करते समय JIT (जस्ट-इन-टाइम) संकलन का उपयोग करके बाइनरी में बायटेकोड को संकलित करता है।

हॉटस्पॉट

एक विशिष्ट कार्यक्रम में, कोड का केवल एक छोटा सा खंड होता है जिसे अक्सर निष्पादित किया जाता है, और अक्सर, यह कोड होता है जो पूरे एप्लिकेशन के प्रदर्शन को महत्वपूर्ण रूप से प्रभावित करता है। कोड के ऐसे वर्गों को कहा जाता हैHotSpots

यदि कोड के कुछ खंड को केवल एक बार निष्पादित किया जाता है, तो इसे संकलित करना प्रयास की बर्बादी होगी, और इसके बजाय बाइटकोड की व्याख्या करना तेजी से होगा। लेकिन अगर यह खंड एक गर्म खंड है और कई बार क्रियान्वित किया जाता है, तो JVM इसके बजाय इसे संकलित करेगा। उदाहरण के लिए, यदि किसी विधि को कई बार कहा जाता है, तो कोड को संकलित करने के लिए जो अतिरिक्त चक्र होगा वह उत्पन्न होने वाले तेज बाइनरी द्वारा ऑफसेट किया जाएगा।

इसके अलावा, जितना अधिक JVM एक विशेष विधि या लूप चलाता है, उतनी ही अधिक जानकारी यह विविध अनुकूलन बनाने के लिए इकट्ठा होती है ताकि एक तेज बाइनरी उत्पन्न हो।

हमें निम्नलिखित कोड पर विचार करें -

for(int i = 0 ; I <= 100; i++) {
   System.out.println(obj1.equals(obj2)); //two objects
}

यदि इस कोड की व्याख्या की जाती है, तो दुभाषिया obj1 की कक्षाओं के प्रत्येक पुनरावृत्ति के लिए कटौती करेगा। ऐसा इसलिए है क्योंकि जावा में प्रत्येक वर्ग में एक। असमान () विधि है, जिसे ऑब्जेक्ट क्लास से बढ़ाया जाता है और इसे ओवरराइड किया जा सकता है। इसलिए भले ही obj1 प्रत्येक पुनरावृत्ति के लिए एक स्ट्रिंग है, फिर भी कटौती की जाएगी।

दूसरी ओर, वास्तव में ऐसा क्या होगा कि JVM यह नोटिस करेगा कि प्रत्येक पुनरावृत्ति के लिए, obj1 वर्ग स्ट्रिंग का है और इसलिए, यह सीधे स्ट्रिंग वर्ग की (।) विधि के अनुरूप कोड उत्पन्न करेगा। इस प्रकार, कोई लुकअप की आवश्यकता नहीं होगी, और संकलित कोड तेजी से निष्पादित होगा।

इस तरह का व्यवहार केवल तभी संभव है जब जेवीएम जानता है कि कोड कैसे व्यवहार करता है। इस प्रकार, यह कोड के कुछ वर्गों को संकलित करने से पहले इंतजार करता है।

नीचे एक और उदाहरण दिया गया है -

int sum = 7;
for(int i = 0 ; i <= 100; i++) {
   sum += i;
}

प्रत्येक लूप के लिए एक दुभाषिया, मेमोरी से 'सम' का मूल्य प्राप्त करता है, इसमें 'I' जोड़ता है, और इसे मेमोरी में वापस संग्रहीत करता है। मेमोरी एक्सेस एक महंगा ऑपरेशन है और आमतौर पर कई सीपीयू साइकल लेते हैं। चूंकि यह कोड कई बार चलता है, इसलिए यह एक हॉटस्पॉट है। JIT इस कोड को संकलित करेगा और निम्नलिखित अनुकूलन करेगा।

'सम' की एक स्थानीय प्रति एक रजिस्टर में संग्रहीत की जाएगी, जो एक विशेष धागे के लिए विशिष्ट होगी। सभी संचालन रजिस्टर में मूल्य के लिए किया जाएगा और जब लूप पूरा हो जाएगा, तो मूल्य को मेमोरी में वापस लिखा जाएगा।

क्या होगा अगर अन्य धागे भी चर तक पहुंच रहे हैं? चूँकि अद्यतन किसी अन्य थ्रेड द्वारा वैरिएबल की एक स्थानीय प्रति के लिए किया जा रहा है, इसलिए उन्हें बासी मान दिखाई देगा। ऐसे मामलों में थ्रेड सिंक्रोनाइजेशन की जरूरत होती है। एक बहुत ही मूल सिंक प्राइमरी को 'राशि' को अस्थिर घोषित करना होगा। अब, एक चर को एक्सेस करने से पहले, एक थ्रेड अपने स्थानीय रजिस्टर को फ्लश करेगा और मेमोरी से मूल्य प्राप्त करेगा। इसे एक्सेस करने के बाद, मान को तुरंत मेमोरी में लिखा जाता है।

नीचे कुछ सामान्य अनुकूलन दिए गए हैं जो जेआईटी संकलक द्वारा किए गए हैं -

  • विधि inlining
  • मृत कोड उन्मूलन
  • कॉल साइटों के अनुकूलन के लिए आंकड़े
  • लगातार तह