विलंबता सहिष्णुता
माइक्रोप्रोसेसरों की गति प्रति दशक दस से अधिक के कारक से अधिक हो गई है, लेकिन कमोडिटी यादों (डीआरएएम) की गति केवल दोगुनी हो गई है, अर्थात, पहुंच का समय आधा हो गया है। इसलिए, प्रोसेसर घड़ी चक्र के संदर्भ में मेमोरी एक्सेस की विलंबता 10 वर्षों में छह के कारक से बढ़ती है। मल्टीप्रोसेसर ने समस्या को और तेज कर दिया।
बस-आधारित प्रणालियों में, प्रोसेसर और मेमोरी के बीच एक उच्च-बैंडविड्थ बस की स्थापना से मेमोरी से डेटा प्राप्त करने की विलंबता बढ़ जाती है। जब मेमोरी को भौतिक रूप से वितरित किया जाता है, तो नेटवर्क और नेटवर्क इंटरफ़ेस की विलंबता को नोड पर स्थानीय मेमोरी तक पहुंचने के लिए जोड़ा जाता है।
आमतौर पर मशीन के आकार के साथ विलंबता बढ़ती है, क्योंकि अधिक नोड्स गणना के सापेक्ष अधिक संचार का संकेत देते हैं, सामान्य संचार के लिए नेटवर्क में अधिक कूद, और अधिक विवाद होने की संभावना है। हार्डवेयर डिज़ाइन का मुख्य लक्ष्य उच्च, मापनीय बैंडविड्थ को बनाए रखते हुए डेटा एक्सेस की विलंबता को कम करना है।
विलंबता सहिष्णुता का अवलोकन
मशीन में संसाधनों को देखकर और उन्हें कैसे उपयोग किया जाता है, यह समझने के लिए विलंबता सहिष्णुता को कैसे नियंत्रित किया जाता है। प्रोसेसर के दृष्टिकोण से, एक नोड से दूसरे नोड में संचार वास्तुकला को पाइप लाइन के रूप में देखा जा सकता है। पाइपलाइन के चरणों में स्रोत और गंतव्य पर नेटवर्क इंटरफेस, साथ ही साथ रास्ते में नेटवर्क लिंक और स्विच शामिल हैं। संचार सहायता में भी चरण होते हैं, स्थानीय मेमोरी / कैश सिस्टम, और मुख्य प्रोसेसर, इस बात पर निर्भर करता है कि वास्तुकला संचार का प्रबंधन कैसे करता है।
बेसलाइन संचार संरचना में उपयोग की समस्या या तो प्रोसेसर है या संचार वास्तुकला एक निश्चित समय में व्यस्त है, और संचार पाइपलाइन में केवल एक चरण व्यस्त है क्योंकि एकल शब्द प्रेषित किया जा रहा है जो स्रोत से गंतव्य तक अपना रास्ता बनाता है। विलंबता सहिष्णुता का उद्देश्य इन संसाधनों के उपयोग को यथासंभव अधिक करना है।
स्पष्ट संदेश पारित करने में विलंबता सहिष्णुता
संदेश भेजने में डेटा का वास्तविक हस्तांतरण आम तौर पर प्रेषक-आरंभ होता है, एक भेजने के संचालन का उपयोग करके। एक प्राप्त संचालन अपने आप में डेटा को संचारित करने के लिए प्रेरित नहीं करता है, बल्कि एक आने वाले बफर से डेटा को एप्लिकेशन एड्रेस स्पेस में कॉपी करता है। रिसीवर-आरंभ संचार उस प्रक्रिया को एक अनुरोध संदेश जारी करके किया जाता है जो डेटा का स्रोत है। इसके बाद प्रक्रिया दूसरे डेटा को वापस भेजती है।
एक सिंक्रोनस सेंड ऑपरेशन में संचार लेटेंसी के बराबर समय होता है, जो मैसेज में मौजूद सभी डेटा को डेस्टिनेशन, और प्रोसेसिंग प्राप्त करने का समय, और पावती के वापस आने के समय के बराबर होता है। एक तुल्यकालिक प्राप्त ऑपरेशन की विलंबता इसकी प्रसंस्करण ओवरहेड है; जिसमें डेटा को एप्लिकेशन में कॉपी करना, और अतिरिक्त विलंबता शामिल है यदि डेटा अभी तक नहीं आया है। हम इन अक्षांशों को छिपाना चाहते हैं, यदि संभव हो तो ओवरहेड्स सहित, दोनों सिरों पर।
साझा पता स्थान में विलंबता सहिष्णुता
बेसलाइन संचार एक साझा पता स्थान में रीड और राइट के माध्यम से होता है। सुविधा के लिए, इसे रीड-राइट संचार कहा जाता है। रिसीवर द्वारा शुरू किया गया संचार रीड ऑपरेशंस के साथ किया जाता है जिसके परिणामस्वरूप किसी अन्य प्रोसेसर की मेमोरी या कैश तक डेटा का उपयोग किया जाता है। यदि साझा डेटा की कोई कैशिंग नहीं है, तो प्रेषक द्वारा आरंभ किए गए संचार को उन डेटा के माध्यम से किया जा सकता है जो दूरस्थ यादों में आवंटित किए गए हैं।
कैश सुसंगतता के साथ, राइट्स का प्रभाव अधिक जटिल होता है: या तो लिखता है या प्रेषक को रिसीव किया जाता है। या तो रिसीवर-पहल या प्रेषक द्वारा शुरू किया गया, एक हार्डवेयर-समर्थित रीड में साझा साझा स्थान पर संचार स्वाभाविक रूप से ठीक-ठीक होता है, जो सहनशीलता विलंबता को बहुत महत्वपूर्ण बनाता है।
साझा पता स्थान में डेटा स्थानांतरण ब्लॉक करें
एक साझा पता स्थान में, हार्डवेयर या सॉफ़्टवेयर द्वारा डेटा का तालमेल और ब्लॉक स्थानांतरण की दीक्षा उपयोगकर्ता प्रोग्राम में या सिस्टम द्वारा पारदर्शी रूप से की जा सकती है। उपयोगकर्ता प्रोग्राम में भेजने के समान एक कमांड निष्पादित करके स्पष्ट ब्लॉक स्थानांतरण शुरू किए जाते हैं। प्रेषक कमांड को संचार सहायता द्वारा समझाया गया है, जो स्रोत नोड से गंतव्य तक पाइपलाइज्ड तरीके से डेटा स्थानांतरित करता है। गंतव्य पर, संचार सहायता नेटवर्क इंटरफ़ेस से डेटा शब्दों को खींचती है और उन्हें निर्दिष्ट स्थानों में संग्रहीत करती है।
सेंड-रिसीव मैसेज पासिंग से दो मुख्य अंतर हैं, दोनों इस तथ्य से उत्पन्न होते हैं कि भेजने की प्रक्रिया सीधे प्रोग्राम डेटा संरचनाओं को निर्दिष्ट कर सकती है जहां डेटा को गंतव्य पर रखा जाना है, क्योंकि ये स्थान साझा पता स्थान में हैं ।
साझा पता स्थान में पिछले लंबे समय तक विलंबता घटनाओं की कार्यवाही
यदि मेमोरी ऑपरेशन को गैर-अवरुद्ध किया जाता है, तो एक प्रोसेसर अन्य निर्देशों के लिए मेमोरी ऑपरेशन को आगे बढ़ा सकता है। लिखने के लिए, यह आमतौर पर लागू करने के लिए काफी सरल होता है यदि लेखन को एक बफर में डाल दिया जाता है, और प्रोसेसर तब तक चलता है जब बफर मेमोरी सिस्टम को लिखने को जारी करने और आवश्यकतानुसार इसके पूरा होने पर नज़र रखता है। अंतर यह है कि एक लेखन के विपरीत, एक रीड आम तौर पर एक निर्देश द्वारा बहुत जल्द ही पालन किया जाता है जिसे रीड द्वारा लौटाए गए मान की आवश्यकता होती है।
साझा पता स्थान में पूर्व संचार
पूर्व-संचार एक ऐसी तकनीक है जिसे पहले से ही वाणिज्यिक माइक्रोप्रोसेसरों में व्यापक रूप से अपनाया गया है, और भविष्य में इसका महत्व बढ़ने की संभावना है। प्रीफ़ैच निर्देश डेटा आइटम के वास्तविक रीड को प्रतिस्थापित नहीं करता है, और प्रीफ़ैच इंस्ट्रक्शन स्वयं को गैर-अवरोधक होना चाहिए, यदि यह ओवरलैप के माध्यम से विलंबता को छुपाने के अपने लक्ष्य को प्राप्त करना है।
इस मामले में, जैसा कि साझा डेटा को कैश नहीं किया जाता है, प्रीफ़ेट किए गए डेटा को एक विशेष हार्डवेयर संरचना में लाया जाता है जिसे प्रीफ़ेच बफर कहा जाता है। जब शब्द वास्तव में अगले पुनरावृत्ति में एक रजिस्टर में पढ़ा जाता है, तो इसे मेमोरी से बजाय प्रीफ़च बफर के सिर से पढ़ा जाता है। यदि छिपने की विलंबता एकल लूप पुनरावृत्ति की गणना करने के लिए समय से बहुत बड़ी थी, तो हम आगे कई पुनरावृत्तियों को प्राथमिकता देंगे और संभवतः एक समय में प्रीफ़च बफर में कई शब्द होंगे।
एक साझा पता स्थान में मल्टीथ्रेडिंग
विभिन्न प्रकार की विलंबता को छिपाने के संदर्भ में, हार्डवेयर समर्थित मल्टीथ्रेडिंग शायद बहुमुखी तकनीक है। अन्य दृष्टिकोणों पर इसके वैचारिक लाभ हैं -
इसके लिए किसी विशेष सॉफ्टवेयर विश्लेषण या समर्थन की आवश्यकता नहीं है।
जैसा कि यह गतिशील रूप से आह्वान किया गया है, यह अप्रत्याशित स्थितियों को संभाल सकता है, जैसे कि कैश टकराव आदि, साथ ही साथ पूर्वानुमान लगाने योग्य भी।
प्रीफ़ेटिंग की तरह, यह मेमोरी संगतता मॉडल को नहीं बदलता है क्योंकि यह एक थ्रेड के भीतर एक्सेस को फिर से नहीं करता है।
जबकि पिछली तकनीकों को मेमोरी एक्सेस लेटेंसी को छिपाने के लिए लक्षित किया जाता है, मल्टीथ्रेडिंग किसी भी लंबी-विलंबता घटना की विलंबता को आसानी से छिपा सकती है, जब तक कि रनटाइम पर घटना का पता लगाया जा सकता है। इसमें सिंक्रोनाइज़ेशन और इंस्ट्रक्शन लेटेंसी भी शामिल है।
यह प्रवृत्ति भविष्य में बदल सकती है, क्योंकि प्रोसेसर की गति की तुलना में विलंबता अधिक लंबी होती जा रही है। इसके अलावा अधिक परिष्कृत माइक्रोप्रोसेसरों के साथ जो पहले से ही उन तरीकों को प्रदान करते हैं जिन्हें मल्टीथ्रेडिंग के लिए बढ़ाया जा सकता है, और नए मल्टीथ्रेडिंग तकनीकों को निर्देश-स्तरीय समानता के साथ मल्टीथ्रेडिंग को संयोजित करने के लिए विकसित किया जा रहा है, यह प्रवृत्ति निश्चित रूप से भविष्य में कुछ बदलाव से गुजर रही है।