काउचडीबी - परिचय

डेटाबेस प्रबंधन प्रणाली डेटा के भंडारण और पुनर्प्राप्ति के लिए तंत्र प्रदान करती है। आरडीबीएमएस (रिलेशनल डेटाबेस मैनेजमेंट सिस्टम), ओएलएपी (ऑनलाइन एनालिटिकल प्रोसेसिंग सिस्टम) और नोएसक्यूएल जैसे तीन मुख्य प्रकार के डेटाबेस मैनेजमेंट सिस्टम हैं।

आरडीबीएमएस

RDBMS का संबंध रिलेशनल डेटाबेस मैनेजमेंट सिस्टम से है। RDBMS SQL का आधार है, और सभी आधुनिक डेटाबेस सिस्टम जैसे MS SQL Server, IBM DB2, Oracle, MySQL और Microsoft Access के लिए।

एक रिलेशनल डेटाबेस मैनेजमेंट सिस्टम (RDBMS) एक डेटाबेस मैनेजमेंट सिस्टम (DBMS) है जो कि EF Codd द्वारा शुरू किए गए रिलेशनल मॉडल पर आधारित है।

RDBMS में डेटा को डेटाबेस ऑब्जेक्ट्स में संग्रहीत किया जाता है जिसे कहा जाता है tables। तालिका संबंधित डेटा प्रविष्टियों का एक संग्रह है और इसमें कॉलम और पंक्तियाँ हैं। यह केवल संरचित डेटा संग्रहीत करता है।

OLAP

ऑनलाइन एनालिटिकल प्रोसेसिंग सर्वर (OLAP) बहुआयामी डेटा मॉडल पर आधारित है। यह प्रबंधकों और विश्लेषकों को सूचनाओं की तेज, सुसंगत, और सूचना के लिए इंटरैक्टिव पहुंच के माध्यम से जानकारी प्राप्त करने की अनुमति देता है।

NoSQL डेटाबेस

एक NoSQL डेटाबेस (कभी-कभी केवल एसक्यूएल के रूप में कहा जाता है) एक डेटाबेस है जो संबंधपरक डेटाबेस में उपयोग किए गए सारणीबद्ध संबंधों के अलावा डेटा को संग्रहीत और पुनर्प्राप्त करने के लिए एक तंत्र प्रदान करता है। ये डेटाबेस स्कीमा-रहित हैं, आसान प्रतिकृति का समर्थन करते हैं, सरल एपीआई हैं, अंततः सुसंगत हैं, और बड़ी मात्रा में डेटा (बड़ा डेटा) संभाल सकते हैं।

NoSQL डेटाबेस का प्राथमिक उद्देश्य निम्नलिखित है -

  • डिजाइन की सादगी,
  • क्षैतिज स्केलिंग, और
  • उपलब्धता पर महीन नियंत्रण।

NoSQL डेटाबेस रिलेशनल डेटाबेस की तुलना में विभिन्न डेटा संरचनाओं का उपयोग करते हैं। यह NoSQL में कुछ ऑपरेशन तेज करता है। किसी दिए गए NoSQL डेटाबेस की उपयुक्तता उस समस्या पर निर्भर करती है जो इसे हल करना चाहिए। ये डेटाबेस संरचित डेटा और अनस्ट्रक्चर्ड डेटा जैसे ऑडियो फ़ाइलों, वीडियो फ़ाइलों, दस्तावेज़ों आदि को संग्रहीत करते हैं। इन NoSQL डेटाबेस को तीन प्रकारों में वर्गीकृत किया गया है और इन्हें नीचे समझाया गया है।

Key-value Store- ये डेटाबेस कुंजी-मूल्य जोड़े में डेटा संग्रहीत करने के लिए डिज़ाइन किए गए हैं और इन डेटाबेस में कोई स्कीमा नहीं होगा। इन डेटाबेस में, प्रत्येक डेटा मान में एक अनुक्रमित कुंजी और उस कुंजी के लिए एक मान होता है।

उदाहरण - बर्कलेबीडीबी, कैसेंड्रा, डायनमोडीबी, रीक।

Column Store- इन डेटाबेस में, डेटा के स्तंभों में वर्गीकृत कोशिकाओं में डेटा संग्रहीत किया जाता है, और इन स्तंभों को आगे कॉलम परिवारों में वर्गीकृत किया जाता है। इन कॉलम परिवारों में किसी भी संख्या में कॉलम हो सकते हैं।

उदाहरण - BigTable, HBase, और HyperTable।

Document Store- ये कुंजी-मूल्य स्टोर के मूल विचार पर विकसित डेटाबेस हैं जहां "दस्तावेजों" में अधिक जटिल डेटा होते हैं। यहां, प्रत्येक दस्तावेज़ को एक अद्वितीय कुंजी दी गई है, जिसका उपयोग दस्तावेज़ को पुनः प्राप्त करने के लिए किया जाता है। इन्हें दस्तावेज़-उन्मुख जानकारी संग्रहीत करने, पुनर्प्राप्त करने और प्रबंधित करने के लिए डिज़ाइन किया गया है, जिसे अर्ध-संरचित डेटा के रूप में भी जाना जाता है।

उदाहरण - काउचडीबी और मोंगोबडी।

CouchDB क्या है?

CouchDB अपाचे सॉफ्टवेयर फाउंडेशन द्वारा विकसित एक खुला स्रोत डेटाबेस है। फोकस वेब का उपयोग करते हुए, उपयोग में आसानी पर है। यह एक NoSQL दस्तावेज़ स्टोर डेटाबेस है।

यह JSON का उपयोग डेटा (दस्तावेज़), जावा स्क्रिप्ट को अपनी क्वेरी भाषा के रूप में दस्तावेज़ों को बदलने के लिए करता है, दस्तावेज़ों तक पहुंचने के लिए एपीआई के लिए http प्रोटोकॉल, वेब ब्राउज़र के साथ सूचकांकों को क्वेरी करता है। यह 2005 में जारी एक मल्टी मास्टर एप्लीकेशन है और यह 2008 में एक अपाचे प्रोजेक्ट बन गया।

CouchDB क्यों?

  • CouchDB में HTTP- आधारित REST API है, जो डेटाबेस से आसानी से संवाद करने में मदद करता है। और HTTP संसाधनों और विधियों (GET, PUT, DELETE) की सरल संरचना को समझना और उपयोग करना आसान है।

  • जैसा कि हम लचीले दस्तावेज़-आधारित संरचना में डेटा संग्रहीत करते हैं, डेटा की संरचना के बारे में चिंता करने की कोई आवश्यकता नहीं है।

  • उपयोगकर्ताओं को शक्तिशाली डेटा मैपिंग प्रदान की जाती है, जो सूचना को क्वेरी, संयोजन और फ़िल्टर करने की अनुमति देता है।

  • CouchDB आसान उपयोग प्रतिकृति प्रदान करता है, जिसके उपयोग से आप डेटाबेस और मशीनों के बीच डेटा को कॉपी, शेयर और सिंक्रनाइज़ कर सकते हैं।

डेटा मॉडल

  • CouchDB में डेटाबेस सबसे बाहरी डेटा संरचना / कंटेनर है।

  • प्रत्येक डेटाबेस स्वतंत्र दस्तावेजों का एक संग्रह है।

  • प्रत्येक दस्तावेज़ अपने स्वयं के डेटा और स्व-निहित स्कीमा को बनाए रखता है।

  • दस्तावेज़ मेटाडेटा में संशोधन की जानकारी शामिल है, जो डेटाबेस के डिस्कनेक्ट होने के दौरान अंतर को मर्ज करने के लिए संभव बनाता है।

  • CouchDB लेखन के दौरान डेटाबेस फ़ील्ड को लॉक करने की आवश्यकता से बचने के लिए बहु संस्करण संगामिति नियंत्रण लागू करता है।

CouchDB की विशेषताएं: सामग्री को कम करें

दस्तावेज़ संग्रहण

CouchDB एक दस्तावेज़ संग्रहण NoSQL डेटाबेस है। यह अद्वितीय नामों के साथ दस्तावेज़ों को संग्रहीत करने की सुविधा प्रदान करता है, और यह डेटाबेस दस्तावेज़ों को पढ़ने और अद्यतन करने (जोड़ने, संपादित करने, हटाने) के लिए RESTful HTTP API नामक एक एपीआई भी प्रदान करता है।

CouchDB में, दस्तावेज़ डेटा की प्राथमिक इकाई हैं और इनमें मेटाडेटा भी शामिल है। दस्तावेज़ फ़ील्ड को विशिष्ट रूप से नाम दिया गया है और इसमें अलग-अलग प्रकार (पाठ, संख्या, बूलियन, सूचियां, आदि) के मान शामिल हैं, और पाठ आकार या तत्व गणना की कोई निर्धारित सीमा नहीं है।

दस्तावेज़ अपडेट (जोड़ें, संपादित करें, हटाएं) एटोमिसिटी का पालन करें, अर्थात, वे पूरी तरह से सहेजे जाएंगे या बिल्कुल नहीं सहेजे जाएंगे। डेटाबेस में आंशिक रूप से सहेजे गए या संपादित दस्तावेज़ नहीं होंगे।

Json दस्तावेज़ संरचना

{
   "field" : "value",
   "field" : "value",
   "field" : "value",
}

ACID गुण

CouchDB में इसकी एक विशेषता के रूप में ACID गुण हैं।

संगति - जब CouchDB में डेटा एक बार प्रतिबद्ध था, तो यह डेटा संशोधित या अधिलेखित नहीं किया जाएगा। इस प्रकार, CouchDB यह सुनिश्चित करता है कि डेटाबेस फ़ाइल हमेशा एक सुसंगत स्थिति में होगी।

CouchDB रीड्स द्वारा एक मल्टी-वर्ज़न कॉन्सिरेन्सी कंट्रोल (MVCC) मॉडल का उपयोग किया जाता है, जिसके कारण क्लाइंट को रीड ऑपरेशन के आरंभ से अंत तक डेटाबेस का एक सुसंगत स्नैपशॉट दिखाई देगा।

जब भी कोई दस्तावेज़ अपडेट किया जाता है, CouchDB डेटा को डिस्क में फ्लश कर देता है, और फ़ाइल के पहले 4k को बनाने के लिए अद्यतन डेटाबेस हेडर को लगातार दो और समान चंक्स में लिखा जाता है, और फिर सिंक्रोनाइज़ डिस्क में फ्लश किया जाता है। फ्लश के दौरान आंशिक अपडेट को छोड़ दिया जाएगा।

यदि शीर्षलेख करते समय विफलता हुई है, तो पिछले समान हेडर की एक जीवित प्रतिलिपि बनी रहेगी, जो पहले से किए गए सभी डेटा की सुसंगतता सुनिश्चित करती है। हेडर क्षेत्र को छोड़कर, क्रैश या बिजली की विफलता के बाद स्थिरता चेक या फिक्स-अप कभी भी आवश्यक नहीं होते हैं।

संघनन

जब भी डेटाबेस फ़ाइल में स्थान निश्चित सीमा से ऊपर बर्बाद हो गया, सभी सक्रिय डेटा को एक नई फ़ाइल में कॉपी (क्लोन) किया जाएगा। जब नकल की प्रक्रिया पूरी तरह से हो जाएगी, तो पुरानी फाइल को छोड़ दिया जाएगा। यह सब संघनन प्रक्रिया द्वारा किया जाता है। कंपटीशन के दौरान डेटाबेस ऑनलाइन रहता है और सभी अपडेट और रीड को सफलतापूर्वक पूरा करने की अनुमति होती है।

दृश्य

काउचडीबी में डेटा अर्ध-संरचित दस्तावेजों में संग्रहीत होता है जो व्यक्तिगत अंतर्निहित संरचनाओं के साथ लचीले होते हैं, लेकिन यह डेटा भंडारण और साझा करने के लिए एक सरल दस्तावेज़ मॉडल है। यदि हम अपना डेटा कई अलग-अलग तरीकों से देखना चाहते हैं, तो हमें उन डेटा को फ़िल्टर करने, व्यवस्थित करने और रिपोर्ट करने का एक तरीका चाहिए, जो तालिकाओं में विघटित न हों।

इस समस्या को हल करने के लिए, CouchDB एक दृश्य मॉडल प्रदान करता है। दृश्य डेटाबेस में दस्तावेज़ों को एकत्र करने और रिपोर्ट करने की विधि है, और डेटाबेस दस्तावेज़ों को एकत्र करने, शामिल करने और रिपोर्ट करने की माँग पर बनाए गए हैं। क्योंकि विचार गतिशील रूप से निर्मित होते हैं और अंतर्निहित दस्तावेज़ को प्रभावित नहीं करते हैं, आपके पास एक ही डेटा के कई अलग-अलग दृश्य प्रतिनिधित्व हो सकते हैं जैसे आप चाहते हैं।

इतिहास

  • CouchDB Erlang प्रोग्रामिंग भाषा में लिखा गया था।
  • इसकी शुरुआत 2005 में डेमियन काट्ज ने की थी।
  • CouchDB 2008 में एक अपाचे परियोजना बन गई।

CouchDB का वर्तमान संस्करण 1.61 है।