कैसेंड्रा - डेटा मॉडल

कैसेंड्रा का डेटा मॉडल सामान्य रूप से एक आरडीबीएमएस में जो हम देखते हैं, उससे काफी अलग है। यह अध्याय कैसंड्रा अपने डेटा को कैसे संग्रहीत करता है, इसका अवलोकन प्रदान करता है।

समूह

कैसंड्रा डेटाबेस कई मशीनों पर वितरित किया जाता है जो एक साथ काम करते हैं। सबसे बाहरी कंटेनर को क्लस्टर के रूप में जाना जाता है। विफलता से निपटने के लिए, प्रत्येक नोड में एक प्रतिकृति होती है, और विफलता के मामले में, प्रतिकृति चार्ज करती है। कैसेंड्रा एक नोड में एक रिंग प्रारूप में नोड्स की व्यवस्था करता है, और उन्हें डेटा असाइन करता है।

Keyspace

कैसेंड्रा में डेटा के लिए कीस्पेस सबसे बाहरी कंटेनर है। कैसेंड्रा में एक कुंजीस्पेस की बुनियादी विशेषताएं हैं -

  • Replication factor - यह क्लस्टर में मशीनों की संख्या है जो एक ही डेटा की प्रतियां प्राप्त करेंगे।

  • Replica placement strategy- यह रिंग में प्रतिकृतियां रखने की रणनीति के अलावा और कुछ नहीं है। हमारे पास ऐसी रणनीतियां हैंsimple strategy (रैक-जागरूक रणनीति), old network topology strategy (रैक-जागरूक रणनीति), और network topology strategy (डेटासेंटर-साझा रणनीति)।

  • Column families- कीस्पेस एक या अधिक कॉलम परिवारों की सूची के लिए एक कंटेनर है। एक स्तंभ परिवार, बदले में, पंक्तियों के संग्रह का एक कंटेनर है। प्रत्येक पंक्ति में आदेशित कॉलम होते हैं। कॉलम परिवार आपके डेटा की संरचना का प्रतिनिधित्व करते हैं। प्रत्येक कीस्पेस में कम से कम एक और अक्सर कई कॉलम परिवार होते हैं।

Keyspace बनाने का सिंटैक्स इस प्रकार है -

CREATE KEYSPACE Keyspace name
WITH replication = {'class': 'SimpleStrategy', 'replication_factor' : 3};

निम्न दृष्टांत कीस्पेस के एक योजनाबद्ध दृश्य को दर्शाता है।

कॉलम परिवार

एक कॉलम परिवार पंक्तियों के आदेशित संग्रह के लिए एक कंटेनर है। प्रत्येक पंक्ति, बदले में, स्तंभों का एक क्रमबद्ध संग्रह है। निम्न तालिका उन बिंदुओं को सूचीबद्ध करती है जो संबंधपरक डेटाबेस की तालिका से स्तंभ परिवार को अलग करती हैं।

संबंधपरक तालिका कैसंड्रा स्तंभ परिवार
एक संबंधपरक मॉडल में एक स्कीमा तय किया गया है। एक बार जब हम किसी तालिका के लिए कुछ स्तंभों को परिभाषित करते हैं, तो डेटा सम्मिलित करते समय, प्रत्येक पंक्ति में सभी स्तंभों को कम से कम एक शून्य मान से भरना चाहिए। कैसंड्रा में, हालांकि स्तंभ परिवारों को परिभाषित किया गया है, कॉलम नहीं हैं। आप किसी भी कॉलम परिवार में किसी भी समय किसी भी कॉलम को स्वतंत्र रूप से जोड़ सकते हैं।
रिलेशनल टेबल केवल कॉलम को परिभाषित करते हैं और उपयोगकर्ता मानों के साथ तालिका में भरता है। कैसंड्रा में, एक तालिका में कॉलम होते हैं, या उन्हें सुपर कॉलम परिवार के रूप में परिभाषित किया जा सकता है।

कैसंड्रा स्तंभ परिवार में निम्नलिखित विशेषताएं हैं -

  • keys_cached - यह प्रति SSTable को कैश रखने के लिए स्थानों की संख्या का प्रतिनिधित्व करता है।

  • rows_cached - यह उन पंक्तियों की संख्या को दर्शाता है जिनकी पूरी सामग्री को मेमोरी में कैश किया जाएगा।

  • preload_row_cache - यह निर्दिष्ट करता है कि आप पंक्ति कैश को पूर्व-आबाद करना चाहते हैं या नहीं।

Note − संबंधपरक तालिकाओं के विपरीत जहां एक कॉलम परिवार का स्कीमा तय नहीं होता है, कैसंड्रा सभी पंक्तियों के लिए अलग-अलग पंक्तियों को बाध्य नहीं करता है।

निम्नलिखित आंकड़ा एक कैसंड्रा स्तंभ परिवार का एक उदाहरण दिखाता है।

स्तंभ

एक स्तंभ कैसंड्रा की मूल डेटा संरचना है जिसमें तीन मान हैं, जैसे कि कुंजी या स्तंभ का नाम, मूल्य और एक समय टिकट। नीचे एक कॉलम की संरचना दी गई है।

SuperColumn

एक सुपर कॉलम एक विशेष कॉलम है, इसलिए, यह एक कुंजी-मूल्य जोड़ी भी है। लेकिन एक सुपर कॉलम उप-कॉलम का एक नक्शा संग्रहीत करता है।

आमतौर पर कॉलम परिवारों को व्यक्तिगत फाइलों में डिस्क पर संग्रहीत किया जाता है। इसलिए, प्रदर्शन को अनुकूलित करने के लिए, स्तंभों को रखना महत्वपूर्ण है जिन्हें आप एक ही कॉलम परिवार में एक साथ क्वेरी करने की संभावना रखते हैं, और एक सुपर कॉलम यहां सहायक हो सकता है। नीचे एक सुपर कॉलम की संरचना है।

कैसांद्रा और आरडीबीएमएस के डेटा मॉडल

निम्न तालिका उन बिंदुओं को सूचीबद्ध करती है जो कि कासांद्रा के डेटा मॉडल को RDBMS से अलग करती हैं।

आरडीबीएमएस कैसेंड्रा
RDBMS संरचित डेटा से संबंधित है। कैसेंड्रा अनस्ट्रक्चर्ड डेटा से संबंधित है।
इसका एक निश्चित स्कीमा है। कैसंड्रा में एक लचीला स्कीमा है।
RDBMS में, सारणी सारणियों का एक सरणी है। (ROW x COLUMN) कैसेंड्रा में, एक तालिका "नेस्टेड की-वैल्यू पेयर" की एक सूची है। (ROW x COLUMN कुंजी x COLUMN मान)
डेटाबेस सबसे बाहरी कंटेनर होता है जिसमें एप्लिकेशन के अनुरूप डेटा होता है। कीस्पेस एक बाहरी कंटेनर है जिसमें एक एप्लिकेशन के अनुरूप डेटा होता है।
टेबल्स एक डेटाबेस की इकाइयाँ हैं। टेबल्स या कॉलम परिवार एक कीस्पेस की इकाई हैं।
RD RDMS में रो एक व्यक्तिगत रिकॉर्ड है। रो कैसेंड्रा में प्रतिकृति की एक इकाई है।
स्तंभ एक संबंध की विशेषताओं का प्रतिनिधित्व करता है। स्तंभ कैसंड्रा में भंडारण की एक इकाई है।
RDBMS विदेशी कुंजी की अवधारणाओं का समर्थन करता है, जुड़ता है। संग्रह का उपयोग करके संबंधों का प्रतिनिधित्व किया जाता है।