टेराडाटा - हैशिंग एल्गोरिथम

प्राथमिक इंडेक्स मान के आधार पर एक विशेष AMP को एक पंक्ति सौंपी जाती है। Teradata हैशिंग एल्गोरिथ्म का उपयोग करता है यह निर्धारित करने के लिए कि AMP को पंक्ति मिलती है

निम्नलिखित हैशिंग एल्गोरिथ्म पर एक उच्च स्तरीय आरेख है।

डेटा डालने के लिए निम्नलिखित चरण हैं।

  • क्लाइंट एक क्वेरी सबमिट करता है।

  • पार्सर क्वेरी प्राप्त करता है और हैशिंग एल्गोरिथ्म में रिकॉर्ड का PI मान पास करता है।

  • हैशिंग एल्गोरिथ्म में प्राथमिक सूचकांक मूल्य होता है और रो हैश नामक एक 32 बिट संख्या देता है।

  • हैश मैप प्रविष्टि की पहचान करने के लिए पंक्ति हैश (पहले 16 बिट्स) के उच्च क्रम बिट्स का उपयोग किया जाता है। हैश मैप में एक AMP # होता है। हैश मैप एक प्रकार का बकेट है जिसमें विशिष्ट AMP # होता है।

  • BYNET डेटा को पहचाने गए AMP पर भेजता है।

  • AMP अपने डिस्क के भीतर पंक्ति का पता लगाने के लिए 32 बिट रो हैश का उपयोग करता है।

  • यदि एक ही पंक्ति हैश के साथ कोई रिकॉर्ड है, तो यह विशिष्टता आईडी को बढ़ाता है जो कि 32 बिट संख्या है। नई पंक्ति हैश के लिए, विशिष्टता आईडी को 1 के रूप में असाइन किया गया है और जब भी एक ही पंक्ति हैश के साथ एक रिकॉर्ड डाला जाता है, तो उसे बढ़ाया जाता है।

  • पंक्ति हैश और विशिष्टता आईडी के संयोजन को पंक्ति आईडी कहा जाता है।

  • पंक्ति आईडी डिस्क में प्रत्येक रिकॉर्ड को उपसर्ग करती है।

  • एएमपी में प्रत्येक तालिका पंक्ति तार्किक रूप से उनके रो आईडी द्वारा क्रमबद्ध है।

टेबल्स कैसे स्टोर किए जाते हैं

टेबल्स को उनकी पंक्ति आईडी (पंक्ति हैश + विशिष्टता आईडी) द्वारा क्रमबद्ध किया जाता है और फिर एएमपी के भीतर संग्रहीत किया जाता है। पंक्ति आईडी प्रत्येक डेटा पंक्ति के साथ संग्रहीत की जाती है।

रो हश विशिष्टता आईडी कर्मचारी संख्या पहला नाम उपनाम
2 ए 01 2611 0000 0001 101 माइक जेम्स
2 ए 01 2612 0000 0001 104 एलेक्स स्टुअर्ट
2 ए 01 2613 0000 0001 102 रॉबर्ट विलियम्स
2 ए 01 2614 0000 0001 105 रॉबर्ट जेम्स
2 ए 01 2615 0000 0001 103 पीटर पॉल