टेराडाटा - हैशिंग एल्गोरिथम
प्राथमिक इंडेक्स मान के आधार पर एक विशेष AMP को एक पंक्ति सौंपी जाती है। Teradata हैशिंग एल्गोरिथ्म का उपयोग करता है यह निर्धारित करने के लिए कि AMP को पंक्ति मिलती है
निम्नलिखित हैशिंग एल्गोरिथ्म पर एक उच्च स्तरीय आरेख है।
डेटा डालने के लिए निम्नलिखित चरण हैं।
क्लाइंट एक क्वेरी सबमिट करता है।
पार्सर क्वेरी प्राप्त करता है और हैशिंग एल्गोरिथ्म में रिकॉर्ड का PI मान पास करता है।
हैशिंग एल्गोरिथ्म में प्राथमिक सूचकांक मूल्य होता है और रो हैश नामक एक 32 बिट संख्या देता है।
हैश मैप प्रविष्टि की पहचान करने के लिए पंक्ति हैश (पहले 16 बिट्स) के उच्च क्रम बिट्स का उपयोग किया जाता है। हैश मैप में एक AMP # होता है। हैश मैप एक प्रकार का बकेट है जिसमें विशिष्ट AMP # होता है।
BYNET डेटा को पहचाने गए AMP पर भेजता है।
AMP अपने डिस्क के भीतर पंक्ति का पता लगाने के लिए 32 बिट रो हैश का उपयोग करता है।
यदि एक ही पंक्ति हैश के साथ कोई रिकॉर्ड है, तो यह विशिष्टता आईडी को बढ़ाता है जो कि 32 बिट संख्या है। नई पंक्ति हैश के लिए, विशिष्टता आईडी को 1 के रूप में असाइन किया गया है और जब भी एक ही पंक्ति हैश के साथ एक रिकॉर्ड डाला जाता है, तो उसे बढ़ाया जाता है।
पंक्ति हैश और विशिष्टता आईडी के संयोजन को पंक्ति आईडी कहा जाता है।
पंक्ति आईडी डिस्क में प्रत्येक रिकॉर्ड को उपसर्ग करती है।
एएमपी में प्रत्येक तालिका पंक्ति तार्किक रूप से उनके रो आईडी द्वारा क्रमबद्ध है।
टेबल्स कैसे स्टोर किए जाते हैं
टेबल्स को उनकी पंक्ति आईडी (पंक्ति हैश + विशिष्टता आईडी) द्वारा क्रमबद्ध किया जाता है और फिर एएमपी के भीतर संग्रहीत किया जाता है। पंक्ति आईडी प्रत्येक डेटा पंक्ति के साथ संग्रहीत की जाती है।
रो हश | विशिष्टता आईडी | कर्मचारी संख्या | पहला नाम | उपनाम |
---|---|---|---|---|
2 ए 01 2611 | 0000 0001 | 101 | माइक | जेम्स |
2 ए 01 2612 | 0000 0001 | 104 | एलेक्स | स्टुअर्ट |
2 ए 01 2613 | 0000 0001 | 102 | रॉबर्ट | विलियम्स |
2 ए 01 2614 | 0000 0001 | 105 | रॉबर्ट | जेम्स |
2 ए 01 2615 | 0000 0001 | 103 | पीटर | पॉल |