Teradata - प्रश्न और उत्तर

प्रिय पाठकों, ये Teradata Interview Questions विशेष रूप से आपको उन प्रश्नों की प्रकृति से परिचित कराने के लिए डिज़ाइन किया गया है जिनके विषय के लिए आपके साक्षात्कार के दौरान सामना हो सकता है Teradata। मेरे अनुभव के अनुसार अच्छे साक्षात्कारकर्ता शायद ही आपके साक्षात्कार के दौरान किसी विशेष प्रश्न को पूछने की योजना बनाते हैं, आम तौर पर प्रश्न विषय की कुछ मूल अवधारणा से शुरू होते हैं और बाद में वे आगे की चर्चा और आपके द्वारा दिए गए उत्तर के आधार पर जारी रहते हैं -

टेराडाटा आर्किटेक्चर में तीन घटक होते हैं।

  • Parsing Engine - पार्सिंग इंजन उपयोगकर्ता से क्वेरी प्राप्त करता है, इसे पार्स करता है और निष्पादन योजना तैयार करता है।

  • BYNET - BYNET, पार्सिंग इंजन से निष्पादन योजना प्राप्त करता है और उपयुक्त AMP को भेजता है।

  • AMP- AMP पंक्तियों को संग्रहीत करने और पुनः प्राप्त करने के लिए जिम्मेदार है। यह इससे जुड़े वर्चुअल डिस्क में डेटा स्टोर करता है। इसके अलावा, एएमपी लॉक मैनेजमेंट, स्पेस मैनेजमेंट, सॉर्टिंग और एग्रीगेशन के लिए जिम्मेदार है।

FastLoad MultiLoad
लक्ष्य तालिका खाली होनी चाहिए लक्ष्य तालिका खाली होने की आवश्यकता नहीं है
एकल स्क्रिप्ट का उपयोग करके केवल एक तालिका लोड की जा सकती है 5 टेबल तक लोड / अपडेट कर सकते हैं
केवल बनाने / समर्थन कथन का समर्थन करता है एकल स्क्रिप्ट में 20 डीएमएल बयानों का समर्थन करता है
RI, SI और ट्रिगर के साथ तालिकाओं का समर्थन नहीं करता है NUSI के साथ तालिकाओं का समर्थन करता है

FastLoad चौकियों के माध्यम से पुनरारंभ क्षमता प्रदान करता है। जब स्क्रिप्ट को अंतिम चेकपॉइंट से फिर से शुरू किया जाता है, तो संभव है कि उसी पंक्तियों को फिर से एएमपी में भेजा जाए। यही कारण है कि FastLoad डुप्लिकेट का समर्थन नहीं करता है।

सेट तालिका डुप्लिकेट रिकॉर्ड की अनुमति नहीं देती है जबकि MULTISET डुप्लिकेट रिकॉर्ड की अनुमति देता है।

डाली गई प्रत्येक पंक्ति के लिए, सिस्टम जाँचता है कि क्या एक ही पंक्ति हैश के साथ कोई रिकॉर्ड है। यदि तालिका में UPI परिभाषित है, तो यह डुप्लिकेट के रूप में रिकॉर्ड को अस्वीकार कर देगा। अन्यथा, यह डुप्लिकेट के लिए पूरे रिकॉर्ड की तुलना करेगा। यह सिस्टम प्रदर्शन को गंभीर रूप से प्रभावित करेगा।

डुप्लिकेट पंक्ति की जाँच से बचने के लिए आप या तो विशिष्ट प्राथमिक सूचकांक या विशिष्ट माध्यमिक सूचकांक को परिभाषित कर सकते हैं।

टेबल्स क्रिएट टेबल स्टेटमेंट का उपयोग करके बनाए जाते हैं। टेबल्स का उपयोग करके बनाया जा सकता है

  • स्तंभ की परिभाषा के साथ टेबल विवरण बनाएँ।

  • किसी मौजूदा तालिका से तालिका बनाएँ।

  • चयन कथन के साथ TATE कथन बनाएँ।

डुप्लिकेट रिकॉर्ड की पहचान DISTINCT स्टेटमेंट या ग्रुप बाय स्टेटमेंट का उपयोग करके की जा सकती है।

SELECT DISTINCT column 1, column 2… 
FROM tablename;
  
OR
  
SELECT column 1, column 2,… 
FROM tablename 
GROUP BY column 1, column 2….;
  • तेरदता में प्राथमिक कुंजी अनिवार्य नहीं है, जबकि प्राथमिक सूचकांक अनिवार्य है।

  • डेटा वितरण प्राथमिक सूचकांक मूल्य पर आधारित है।

  • प्राथमिक कुंजियाँ NULL को स्वीकार नहीं करती हैं जबकि प्राथमिक सूचकांक NULL मान को स्वीकार करता है।

  • प्राथमिक कुंजी अद्वितीय हैं जबकि प्राथमिक सूचकांक या तो अद्वितीय (UPI) या गैर अद्वितीय (NUPI) हो सकते हैं।

  • प्राथमिक कुंजी नहीं बदलती है जबकि प्राथमिक सूचकांक बदल जाते हैं।

डेटा को 3 अलग-अलग तरीकों से एक्सेस किया जा सकता है -

  • प्राथमिक सूचकांक के माध्यम से
  • द्वितीयक सूचकांक के माध्यम से
  • पूर्ण तालिका स्कैन

इसे क्वेरी SELECT HASHAMP () + 1 का उपयोग करके पहचाना जा सकता है;

इस कार्य के लिए निम्नलिखित क्वेरी का उपयोग किया जा सकता है।

SELECT HASHMAP(HASHBUCKET(HASHROW(primaryindexvalue))), COUNT(*) 
FROM tablename GROUP BY 1;

टेराडाटा दो लेनदेन मोड का समर्थन करता है।

  • Teradata
  • ANSI

Teradata मोड सेट सत्र ट्रांज़िशन BTET का उपयोग करके सेट किया गया है; एएनएसआई मोड सेट सत्र परिवहन एएनएसआई का उपयोग करके सेट किया गया है;

बीटी और ईटी स्टेटमेंट का उपयोग करके लेन-देन निष्पादित किया जा सकता है।

उपयोगकर्ता द्वारा सीधे अनुक्रमणिका में शामिल नहीं किया जा सकता है। केवल ऑप्टिमाइज़र ही उन्हें एक्सेस कर सकता है।

डुप्लिकेट रिकॉर्ड को लक्ष्य तालिकाओं को लोड करने से अस्वीकार कर दिया जाएगा और उन्हें यूवी तालिका में डाला जाएगा।

FALLBACK, AMP विफलताओं को संभालने के लिए Teradata द्वारा उपयोग किया जाने वाला एक सुरक्षा तंत्र है। प्रत्येक डेटा पंक्ति के लिए, पंक्ति की एक अन्य प्रतिलिपि किसी भिन्न AMP क्लस्टर में संग्रहीत की जाती है। यदि कोई AMP विफल रहता है, तो FALLBACK AMP का उपयोग करके संबंधित पंक्तियों को एक्सेस किया जाएगा।

FALLBACK का उल्लेख क्रिएट टेबल स्टेटमेंट का उपयोग करते हुए टेबल निर्माण के दौरान किया जा सकता है या बाद में टेबल टेबल स्टेटमेंट का उपयोग करके बनाया जाता है।

स्पूल स्पेस एरर तब होगा जब क्वेरी का इंटरमीडिएट परिणाम उस एएमपी स्पूल स्पेस लिमिट से अधिक होगा जो उस यूजर के लिए सेट किया गया है जो क्वेरी सबमिट करता है।

कनेक्शन स्थापित करने के लिए Teradata के प्रयासों से पहले SLEEP कमांड प्रतीक्षा समय को निर्दिष्ट करता है।

टेनेसी कमांड एक नया कनेक्शन स्थापित करने के लिए टेराडाटा के लिए कुल प्रतीक्षा समय को निर्दिष्ट करता है।

आप केवल BEGIN LOADING और END LOADING स्टेटमेंट रख सकते हैं और FASTLOAD स्क्रिप्ट सबमिट कर सकते हैं। अन्य विकल्प तालिका को छोड़ना और तालिका को फिर से बनाना है।

टेराडाटा में कैशिंग स्रोत के साथ काम करता है और उसी क्रम में रहता है, अर्थात यह बार-बार नहीं बदलता है। कैश आमतौर पर अनुप्रयोगों के बीच साझा किया जाता है। यह Teradata का उपयोग करने का एक अतिरिक्त लाभ है।

RAID डिस्क विफलता को संभालने के लिए एक सुरक्षा तंत्र है। यह स्वतंत्र डिस्क के निरर्थक सरणी के लिए है। टेराडाटा में आमतौर पर RAID 1 का उपयोग किया जाता है।

द्वितीयक सूचकांक डेटा तक पहुंचने के लिए वैकल्पिक मार्ग प्रदान करता है। फुल टेबल स्कैन से बचने के लिए इनका उपयोग किया जाता है। हालांकि, उप-तालिकाओं को बनाए रखने के लिए द्वितीयक अनुक्रमिकों को अतिरिक्त शारीरिक संरचना की आवश्यकता होती है और प्रत्येक तालिका के लिए उप तालिका को अद्यतन करने की आवश्यकता होती है, क्योंकि अतिरिक्त I / O की आवश्यकता होती है।

Teradata में चार अलग-अलग ताले हैं - एक्सक्लूसिव, राइट, रीड और एक्सेस।

तीन अलग-अलग स्तरों पर ताले लगाए जा सकते हैं - डेटाबेस, टेबल और पंक्ति।

मल्टी वैल्यू कम्प्रेशन (MVC) का उपयोग कर आप NULLs सहित 255 मानों को संपीड़ित कर सकते हैं।

फास्टलाड 64K ब्लॉक में डेटा लोड करता है। फास्टलाड में 2 चरण हैं।

  • चरण 1 में, यह 64K ब्लॉकों में डेटा लाता है और उन्हें लक्ष्य एएमपी पर भेजता है। प्रत्येक एएमपी तब हैश को उनके लक्ष्य एएमपी में पंक्तियों को फिर से वितरित करेगा।

  • चरण 2 में, पंक्तियों को उनकी पंक्ति हैश क्रम से क्रमबद्ध किया जाता है और लक्ष्य तालिका में लिखा जाता है।

मल्टीआलड आयात में पाँच चरण हैं।

  • Phase 1 प्रारंभिक चरण - मूल सेटअप गतिविधियाँ करता है।

  • Phase 2 - डीएमएल ट्रांजैक्शन फेज - डीएमएल स्टेटमेंट के सिंटैक्स को सत्यापित करता है और उन्हें टेराडाटा सिस्टम में लाता है।

  • Phase 3 - अधिग्रहण चरण - इनपुट डेटा को कार्य तालिकाओं में लाता है और तालिका को लॉक करता है।

  • Phase 4 - आवेदन चरण - सभी डीएमएल संचालन को लागू करता है।

  • Phase 5 - सफाई चरण - टेबल लॉक को रिहा करता है।

ब्लॉक में रिकॉर्ड्स को हटाने के बाद MULTILOAD DELETE तेजी से होता है। DELETE FROM पंक्ति को पंक्ति से हटा देगा।

संग्रहीत प्रक्रिया एक या अधिक मान लौटाती है जबकि मैक्रोज़ एक या अधिक पंक्तियों को वापस कर सकते हैं। SQL के अतिरिक्त, संग्रहीत कार्यविधि में SPL कथन हो सकते हैं।

FastLoad और MultiLoad दोनों 64K ब्लॉकों में डेटा लोड करते हैं जबकि BTEQ एक समय में एक पंक्ति को संसाधित करेगा।

फास्टएक्सपोर्ट 64K ब्लॉकों में डेटा निर्यात करता है जबकि BTEQ एक समय में एक पंक्ति का निर्यात करता है।

Teradata Parallel Transporter (TPT) डेटा को लोड / एक्सपोर्ट करने की उपयोगिता है। यह FastLoad, MultiLoad, BTEQ, TPUMP और FastExport की सभी कार्यात्मकताओं को जोड़ती है।

स्थायी पत्रिकाएँ परिवर्तनों को लागू करने से पहले या बाद में डेटा का ट्रैक रखती हैं। यह किसी विशेष अवस्था में तालिका को आगे या पीछे ले जाने में मदद करता है। स्थायी पत्रिकाओं को टेबल स्तर या डेटाबेस स्तर पर सक्षम किया जा सकता है।

Teradata में, प्रत्येक AMP एक वर्चुअल डिस्क से जुड़ा होता है। वर्चुअल डिस्क का मालिक केवल AMP ही उस वर्चुअल डिस्क के भीतर डेटा तक पहुँच सकता है। इसे साझा कुछ भी नहीं वास्तुकला कहा जाता है।

  • यदि क्वेरी विभाजन वाले स्तंभों का उपयोग करती है तो इसके परिणामस्वरूप विभाजन उन्मूलन होगा, जिससे प्रदर्शन में सुधार होगा।

  • विभाजन अन्य विभाजनों को समाप्त करता है और केवल उन विभाजनों को एक्सेस करता है जिनमें डेटा होता है।

  • आप आसानी से पुराने विभाजन को छोड़ सकते हैं और नए विभाजन बना सकते हैं।

हाँ। द्वितीयक सूचकांक के लिए उप-तालिकाओं की आवश्यकता होती है जिन्हें स्थायी स्थान की आवश्यकता होती है।

हाँ। जब भी विभाजित प्राथमिक सूचकांक को जोड़ा जाता है, तो प्रत्येक संख्या विभाजन संख्या के लिए अतिरिक्त 2 या 8 बाइट्स पर कब्जा कर लेती है।

आप क्वालिफ़ = 2 स्थिति के साथ अवरोही क्रम के साथ निर्दिष्ट कॉलम पर RANK फ़ंक्शन का उपयोग कर सकते हैं।

आप अधिक स्पूल स्पेस की खपत करने वाले चरणों की पहचान करने के लिए क्वेरी के एक्सप्लेन प्लान की जांच कर सकते हैं और क्वेरी को ऑप्टिमाइज़ करने का प्रयास कर सकते हैं। संसाधित किए जाने वाले रिकॉर्ड की संख्या को कम करने के लिए फ़िल्टर लागू किए जा सकते हैं या आप बड़ी क्वेरी को कई छोटे प्रश्नों में विभाजित कर सकते हैं।

जब EXPLAIN कमांड का उपयोग क्वेरी के विरुद्ध किया जाता है, तो यह रिकॉर्ड्स को पुनः प्राप्त करने के लिए ऑप्टिमाइज़र के विश्वास को निर्दिष्ट करता है।

Teradata में तीन आत्मविश्वास स्तर हैं: उच्च आत्मविश्वास, मध्यम आत्मविश्वास, और कम आत्मविश्वास।

NUSI और पूर्ण तालिका स्कैन (FTS) दोनों सभी AMP तक पहुँच प्राप्त करेंगे, लेकिन FTS AMP के भीतर सभी ब्लॉकों तक पहुँच प्राप्त करेंगे, जबकि NUSI ब्लॉक तक तभी पहुँच पाएँगी, जब उप-तालिका में योग्यता पंक्तियाँ हों।

BTEQ मोड में, SKIP कमांड का उपयोग रिकॉर्ड्स को छोड़ने के लिए किया जा सकता है।

BYTEINT। यह केवल एक बाइट पर कब्जा करता है और +127 तक मूल्यों को संग्रहीत कर सकता है।

  • अद्वितीय प्राथमिक सूचकांक के माध्यम से - 1 एएमपी
  • गैर अद्वितीय प्राथमिक सूचकांक के माध्यम से - 1 एएमपी
  • अद्वितीय माध्यमिक सूचकांक के माध्यम से - 2 एएमपी
  • गैर अद्वितीय माध्यमिक सूचकांक के माध्यम से - सभी एएमपी

क्लोड एक सुरक्षा तंत्र है जो नोड विफलताओं को संभालने के लिए है। यह नोड्स का एक समूह है। जब एक गुट के भीतर का नोड विफल हो जाता है, तो vprocs (पार्सिंग इंजन और एएमपी) अन्य नोड्स में चले जाएंगे और अपने वर्चुअल डिस्क पर रीड / राइट ऑपरेशन करना जारी रखेंगे।

टेराडाटा सुरक्षा तंत्र के विभिन्न स्तरों को प्रदान करता है।

  • Transient Journal - लेन-देन की विफलता को संभालने के लिए।

  • Fallback - एएमपी विफलता को संभालने के लिए।

  • Cliques - नोड विफलता को संभालने के लिए।

  • RAID - डिस्क विफलता को संभालने के लिए।

  • Hot standby Node - प्रदर्शन और पुनरारंभ को प्रभावित किए बिना नोड विफलता को संभालने के लिए।

गतिविधि BTEQ में पिछली SQL क्वेरी से प्रभावित पंक्तियों की संख्या देती है। यदि ACTIVITYCOUNT कथन सम्मिलित कथन का अनुसरण करता है, तो यह सम्मिलित पंक्तियों की संख्या लौटाता है। यदि ACTIVITYCOUNT कथन चयनित कथन का अनुसरण करता है, तो यह चयनित पंक्तियों की संख्या लौटाता है।

आगे क्या है?

इसके अलावा आप अपने पिछले असाइनमेंट के माध्यम से जा सकते हैं जो आपने विषय के साथ किया है और सुनिश्चित करें कि आप उन पर आत्मविश्वास से बात करने में सक्षम हैं। यदि आप नए हैं तो साक्षात्कारकर्ता को यह उम्मीद नहीं है कि आप बहुत जटिल प्रश्नों का उत्तर देंगे, बल्कि आपको अपनी मूल अवधारणाओं को बहुत मजबूत बनाना होगा।

दूसरा यह वास्तव में बहुत ज्यादा मायने नहीं रखता है अगर आप कुछ सवालों के जवाब नहीं दे सकते हैं लेकिन यह मायने रखता है कि आपने जो भी उत्तर दिया है, आपने आत्मविश्वास के साथ उत्तर दिया होगा। तो बस अपने साक्षात्कार के दौरान आत्मविश्वास महसूस करें। हम एक अच्छे साक्षात्कारकर्ता और आपके भविष्य के प्रयास के लिए बहुत बहुत शुभकामनाएँ। चियर्स :-)