जावा वर्चुअल मशीन - जेआईटी कंपाइलर
इस अध्याय में, हम JIT संकलक और संकलित और व्याख्या की गई भाषाओं के बीच अंतर के बारे में जानेंगे।
संकलित बनाम व्याख्या की गई भाषाएँ
C, C ++ और FORTRAN जैसी भाषाएँ संकलित भाषाएँ हैं। उनके कोड को अंतर्निहित मशीन पर लक्षित बाइनरी कोड के रूप में दिया जाता है। इसका मतलब यह है कि उच्च-स्तरीय कोड को एक बार एक स्थिर संकलक द्वारा द्विआधारी कोड में संकलित किया गया है जो विशेष रूप से अंतर्निहित वास्तुकला के लिए लिखा गया है। जो बाइनरी उत्पन्न होती है वह किसी अन्य आर्किटेक्चर पर नहीं चलेगी।
दूसरी ओर, पायथन और पर्ल जैसी व्याख्या की गई भाषाएं किसी भी मशीन पर चल सकती हैं, जब तक कि उनके पास एक वैध दुभाषिया हो। यह उच्च-स्तरीय कोड पर लाइन-बाय-लाइन पर जाता है, जो कि बाइनरी कोड में परिवर्तित होता है।
संकलित कोड आमतौर पर संकलित कोड की तुलना में धीमा है। उदाहरण के लिए, एक लूप पर विचार करें। एक व्याख्या लूप के प्रत्येक पुनरावृत्ति के लिए संबंधित कोड को रूपांतरित करेगा। दूसरी ओर, एक संकलित कोड अनुवाद को केवल एक बना देगा। इसके अलावा, चूँकि व्याख्याकार एक समय में केवल एक ही लाइन देखते हैं, इसलिए वे किसी भी महत्वपूर्ण कोड को निष्पादित करने में असमर्थ होते हैं जैसे कि, संकलक जैसे कथनों के निष्पादन के क्रम को बदलना।
हम नीचे इस तरह के अनुकूलन का एक उदाहरण देखेंगे -
Adding two numbers stored in memory। चूँकि मेमोरी एक्सेस करने से कई सीपीयू साइकल का उपभोग किया जा सकता है, एक अच्छा कंपाइलर डेटा को मेमोरी से लाने के लिए निर्देश जारी करेगा और डेटा के उपलब्ध होने पर ही अतिरिक्त क्रियान्वित करेगा। यह इंतजार नहीं करेगा और इस बीच, अन्य निर्देशों को निष्पादित करें। दूसरी ओर, व्याख्या के दौरान ऐसा कोई अनुकूलन संभव नहीं होगा क्योंकि दुभाषिया किसी भी समय पूरे कोड के बारे में नहीं जानता है।
लेकिन फिर, व्याख्या की गई भाषाएं किसी भी मशीन पर चल सकती हैं, जिसमें उस भाषा का एक वैध दुभाषिया होता है।
जावा संकलित या व्याख्या की गई है?
जावा ने बीच का रास्ता खोजने की कोशिश की। चूंकि जेवीएम जेवैक कंपाइलर और अंतर्निहित हार्डवेयर के बीच बैठता है, जेवैक (या कोई अन्य कंपाइलर) कंपाइलर बाइटकोड में जावा कोड को संकलित करता है, जिसे एक प्लेटफॉर्म विशिष्ट जेवीएम द्वारा समझा जाता है। JVM कोड को निष्पादित करते समय JIT (जस्ट-इन-टाइम) संकलन का उपयोग करके बाइनरी में बायटेकोड को संकलित करता है।
हॉटस्पॉट
एक विशिष्ट कार्यक्रम में, कोड का केवल एक छोटा सा खंड होता है जिसे अक्सर निष्पादित किया जाता है, और अक्सर, यह कोड होता है जो पूरे एप्लिकेशन के प्रदर्शन को महत्वपूर्ण रूप से प्रभावित करता है। कोड के ऐसे वर्गों को कहा जाता हैHotSpots।
यदि कोड के कुछ खंड को केवल एक बार निष्पादित किया जाता है, तो इसे संकलित करना प्रयास की बर्बादी होगी, और इसके बजाय बाइटकोड की व्याख्या करना तेजी से होगा। लेकिन अगर यह खंड एक गर्म खंड है और कई बार क्रियान्वित किया जाता है, तो JVM इसके बजाय इसे संकलित करेगा। उदाहरण के लिए, यदि किसी विधि को कई बार कहा जाता है, तो कोड को संकलित करने के लिए जो अतिरिक्त चक्र होगा वह उत्पन्न होने वाले तेज बाइनरी द्वारा ऑफसेट किया जाएगा।
इसके अलावा, जितना अधिक JVM एक विशेष विधि या लूप चलाता है, उतनी ही अधिक जानकारी यह विविध अनुकूलन बनाने के लिए इकट्ठा होती है ताकि एक तेज बाइनरी उत्पन्न हो।
हमें निम्नलिखित कोड पर विचार करें -
for(int i = 0 ; I <= 100; i++) {
System.out.println(obj1.equals(obj2)); //two objects
}
यदि इस कोड की व्याख्या की जाती है, तो दुभाषिया obj1 की कक्षाओं के प्रत्येक पुनरावृत्ति के लिए कटौती करेगा। ऐसा इसलिए है क्योंकि जावा में प्रत्येक वर्ग में एक। असमान () विधि है, जिसे ऑब्जेक्ट क्लास से बढ़ाया जाता है और इसे ओवरराइड किया जा सकता है। इसलिए भले ही obj1 प्रत्येक पुनरावृत्ति के लिए एक स्ट्रिंग है, फिर भी कटौती की जाएगी।
दूसरी ओर, वास्तव में ऐसा क्या होगा कि JVM यह नोटिस करेगा कि प्रत्येक पुनरावृत्ति के लिए, obj1 वर्ग स्ट्रिंग का है और इसलिए, यह सीधे स्ट्रिंग वर्ग की (।) विधि के अनुरूप कोड उत्पन्न करेगा। इस प्रकार, कोई लुकअप की आवश्यकता नहीं होगी, और संकलित कोड तेजी से निष्पादित होगा।
इस तरह का व्यवहार केवल तभी संभव है जब जेवीएम जानता है कि कोड कैसे व्यवहार करता है। इस प्रकार, यह कोड के कुछ वर्गों को संकलित करने से पहले इंतजार करता है।
नीचे एक और उदाहरण दिया गया है -
int sum = 7;
for(int i = 0 ; i <= 100; i++) {
sum += i;
}
प्रत्येक लूप के लिए एक दुभाषिया, मेमोरी से 'सम' का मूल्य प्राप्त करता है, इसमें 'I' जोड़ता है, और इसे मेमोरी में वापस संग्रहीत करता है। मेमोरी एक्सेस एक महंगा ऑपरेशन है और आमतौर पर कई सीपीयू साइकल लेते हैं। चूंकि यह कोड कई बार चलता है, इसलिए यह एक हॉटस्पॉट है। JIT इस कोड को संकलित करेगा और निम्नलिखित अनुकूलन करेगा।
'सम' की एक स्थानीय प्रति एक रजिस्टर में संग्रहीत की जाएगी, जो एक विशेष धागे के लिए विशिष्ट होगी। सभी संचालन रजिस्टर में मूल्य के लिए किया जाएगा और जब लूप पूरा हो जाएगा, तो मूल्य को मेमोरी में वापस लिखा जाएगा।
क्या होगा अगर अन्य धागे भी चर तक पहुंच रहे हैं? चूँकि अद्यतन किसी अन्य थ्रेड द्वारा वैरिएबल की एक स्थानीय प्रति के लिए किया जा रहा है, इसलिए उन्हें बासी मान दिखाई देगा। ऐसे मामलों में थ्रेड सिंक्रोनाइजेशन की जरूरत होती है। एक बहुत ही मूल सिंक प्राइमरी को 'राशि' को अस्थिर घोषित करना होगा। अब, एक चर को एक्सेस करने से पहले, एक थ्रेड अपने स्थानीय रजिस्टर को फ्लश करेगा और मेमोरी से मूल्य प्राप्त करेगा। इसे एक्सेस करने के बाद, मान को तुरंत मेमोरी में लिखा जाता है।
नीचे कुछ सामान्य अनुकूलन दिए गए हैं जो जेआईटी संकलक द्वारा किए गए हैं -
- विधि inlining
- मृत कोड उन्मूलन
- कॉल साइटों के अनुकूलन के लिए आंकड़े
- लगातार तह