DBMS - त्वरित गाइड
Database संबंधित डेटा का एक संग्रह है और डेटा तथ्यों और आंकड़ों का एक संग्रह है जिसे जानकारी उत्पन्न करने के लिए संसाधित किया जा सकता है।
ज्यादातर डेटा रिकॉर्ड करने योग्य तथ्यों का प्रतिनिधित्व करता है। उत्पादन जानकारी में डेटा एड्स, जो तथ्यों पर आधारित है। उदाहरण के लिए, यदि हमारे पास सभी छात्रों द्वारा प्राप्त अंकों के बारे में डेटा है, तो हम टॉपर्स और औसत अंकों के बारे में निष्कर्ष निकाल सकते हैं।
ए database management system डेटा को इस तरह से संग्रहीत करता है कि जानकारी को पुनः प्राप्त करना, हेरफेर करना और उत्पादन करना आसान हो जाता है।
विशेषताएँ
परंपरागत रूप से, डेटा फ़ाइल स्वरूपों में आयोजित किया गया था। DBMS तब एक नई अवधारणा थी, और यह सभी अनुसंधान डेटा प्रबंधन की पारंपरिक शैली में कमियों को दूर करने के लिए किया गया था। एक आधुनिक DBMS की निम्नलिखित विशेषताएं हैं -
Real-world entity- एक आधुनिक DBMS अधिक यथार्थवादी है और इसकी वास्तुकला को डिजाइन करने के लिए वास्तविक दुनिया की संस्थाओं का उपयोग करता है। यह व्यवहार और विशेषताओं का भी उपयोग करता है। उदाहरण के लिए, एक स्कूल डेटाबेस एक विशेषता के रूप में छात्रों को एक इकाई और उनकी उम्र के रूप में उपयोग कर सकता है।
Relation-based tables- DBMS तालिकाओं को बनाने के लिए संस्थाओं और संबंधों को अनुमति देता है। एक उपयोगकर्ता डेटाबेस के आर्किटेक्चर को केवल तालिका के नामों को देखकर समझ सकता है।
Isolation of data and application- एक डेटाबेस सिस्टम इसके डेटा से पूरी तरह से अलग है। एक डेटाबेस एक सक्रिय इकाई है, जबकि डेटा को निष्क्रिय कहा जाता है, जिस पर डेटाबेस काम करता है और व्यवस्थित करता है। DBMS अपनी प्रक्रिया को आसान बनाने के लिए मेटाडेटा को संग्रहीत करता है, जो डेटा के बारे में डेटा है।
Less redundancy- डीबीएमएस सामान्यीकरण के नियमों का पालन करता है, जो किसी भी विशेषता को मूल्यों में अतिरेक होने पर एक संबंध को विभाजित करता है। सामान्यीकरण एक गणितीय रूप से समृद्ध और वैज्ञानिक प्रक्रिया है जो डेटा अतिरेक को कम करती है।
Consistency- संगति एक ऐसी स्थिति है जहां एक डेटाबेस में प्रत्येक संबंध सुसंगत रहता है। ऐसे तरीके और तकनीक मौजूद हैं, जो असंगत स्थिति में डेटाबेस को छोड़ने के प्रयास का पता लगा सकते हैं। एक डीबीएमएस फ़ाइल-प्रोसेसिंग सिस्टम जैसे डेटा भंडारण अनुप्रयोगों के पुराने रूपों की तुलना में अधिक स्थिरता प्रदान कर सकता है।
Query Language- DBMS क्वेरी भाषा से लैस है, जो डेटा को पुनः प्राप्त करने और हेरफेर करने के लिए अधिक कुशल बनाता है। एक उपयोगकर्ता डेटा के एक सेट को पुनः प्राप्त करने के लिए आवश्यक के रूप में कई और विभिन्न फ़िल्टरिंग विकल्पों पर आवेदन कर सकता है। परंपरागत रूप से यह संभव नहीं था जहां फ़ाइल-प्रोसेसिंग सिस्टम का उपयोग किया गया था।
ACID Properties - DBMS की अवधारणाओं का अनुसरण करता है Atomicity, Consistency, Iविलाप, और Dपेशाब की कमी (आमतौर पर एसीआईडी के रूप में छोटा)। इन अवधारणाओं को लेनदेन पर लागू किया जाता है, जो एक डेटाबेस में डेटा में हेरफेर करते हैं। ACID गुण डेटाबेस को बहु-लेन-देन के वातावरण में और विफलता के मामले में स्वस्थ रहने में मदद करते हैं।
Multiuser and Concurrent Access- DBMS बहु-उपयोगकर्ता वातावरण का समर्थन करता है और उन्हें समानांतर में डेटा तक पहुंचने और हेरफेर करने की अनुमति देता है। हालांकि लेन-देन पर प्रतिबंध हैं जब उपयोगकर्ता एक ही डेटा आइटम को संभालने का प्रयास करते हैं, लेकिन उपयोगकर्ता हमेशा उनसे अनजान होते हैं।
Multiple views- DBMS विभिन्न उपयोगकर्ताओं के लिए कई विचार प्रस्तुत करता है। एक उपयोगकर्ता जो बिक्री विभाग में है, उत्पादन विभाग में काम करने वाले व्यक्ति की तुलना में डेटाबेस का एक अलग दृष्टिकोण होगा। यह सुविधा उपयोगकर्ताओं को उनकी आवश्यकताओं के अनुसार डेटाबेस का एक केंद्रित दृष्टिकोण रखने में सक्षम बनाती है।
Security- मल्टीपल व्यू जैसे फीचर कुछ हद तक सुरक्षा प्रदान करते हैं जहां उपयोगकर्ता अन्य उपयोगकर्ताओं और विभागों के डेटा तक पहुंचने में असमर्थ होते हैं। डीबीएमएस डेटाबेस में डेटा दर्ज करते हुए और बाद में एक ही चरण में पुनः प्राप्त करने के लिए बाधाओं को लागू करने के लिए तरीके प्रदान करता है। DBMS सुरक्षा सुविधाओं के कई अलग-अलग स्तर प्रदान करता है, जो कई उपयोगकर्ताओं को विभिन्न सुविधाओं के साथ अलग-अलग विचार रखने में सक्षम बनाता है। उदाहरण के लिए, बिक्री विभाग का एक उपयोगकर्ता उस डेटा को नहीं देख सकता जो खरीद विभाग का है। इसके अतिरिक्त, यह भी प्रबंधित किया जा सकता है कि उपयोगकर्ता को बिक्री विभाग का कितना डेटा प्रदर्शित किया जाना चाहिए। चूंकि DBMS डिस्क पर पारंपरिक फ़ाइल सिस्टम के रूप में सहेजा नहीं गया है, इसलिए बदमाशों के लिए कोड को तोड़ना बहुत कठिन है।
उपयोगकर्ताओं
एक विशिष्ट DBMS में अलग-अलग अधिकारों और अनुमतियों वाले उपयोगकर्ता होते हैं जो इसे विभिन्न उद्देश्यों के लिए उपयोग करते हैं। कुछ उपयोगकर्ता डेटा पुनर्प्राप्त करते हैं और कुछ इसे वापस करते हैं। DBMS के उपयोगकर्ताओं को मोटे तौर पर निम्नानुसार वर्गीकृत किया जा सकता है -
Administrators- व्यवस्थापक DBMS को बनाए रखते हैं और डेटाबेस के प्रबंधन के लिए जिम्मेदार होते हैं। वे इसके उपयोग की देखभाल करने के लिए जिम्मेदार हैं और जिनके द्वारा इसका उपयोग किया जाना चाहिए। वे उपयोगकर्ताओं के लिए एक्सेस प्रोफाइल बनाते हैं और अलगाव और सुरक्षा को बनाए रखने के लिए सीमाएं लागू करते हैं। प्रशासक डीबीएमएस संसाधनों जैसे सिस्टम लाइसेंस, आवश्यक उपकरण और अन्य सॉफ्टवेयर और हार्डवेयर से संबंधित रखरखाव की देखभाल करते हैं।
Designers- डिजाइनर उन लोगों का समूह है जो वास्तव में डेटाबेस के डिजाइनिंग हिस्से पर काम करते हैं। वे इस बात पर पैनी नजर रखते हैं कि क्या डेटा रखा जाना चाहिए और किस प्रारूप में। वे संस्थाओं, संबंधों, बाधाओं और विचारों के पूरे सेट की पहचान और डिजाइन करते हैं।
End Users- अंतिम उपयोगकर्ता वे हैं जो वास्तव में DBMS होने के लाभों को प्राप्त करते हैं। अंतिम उपयोगकर्ता सरल दर्शकों से लेकर हो सकते हैं जो व्यापार विश्लेषकों जैसे परिष्कृत उपयोगकर्ताओं के लिए लॉग या बाजार दरों पर ध्यान देते हैं।
DBMS का डिज़ाइन इसकी वास्तुकला पर निर्भर करता है। इसे केंद्रीकृत या विकेन्द्रीकृत या श्रेणीबद्ध किया जा सकता है। DBMS की वास्तुकला को एकल स्तरीय या बहु स्तरीय के रूप में देखा जा सकता है। एन-टियर आर्किटेक्चर पूरे सिस्टम को संबंधित लेकिन स्वतंत्र में विभाजित करता हैn मॉड्यूल, जिन्हें स्वतंत्र रूप से संशोधित, परिवर्तित, परिवर्तित या बदला जा सकता है।
1-स्तरीय वास्तुकला में, DBMS एकमात्र इकाई है जहां उपयोगकर्ता सीधे DBMS पर बैठता है और इसका उपयोग करता है। यहां किए गए कोई भी परिवर्तन सीधे DBMS पर ही किए जाएंगे। यह एंड-यूजर्स के लिए उपयोगी टूल उपलब्ध नहीं कराता है। डेटाबेस डिजाइनर और प्रोग्रामर आम तौर पर सिंगल-टियर आर्किटेक्चर का उपयोग करना पसंद करते हैं।
यदि DBMS का आर्किटेक्चर 2-स्तरीय है, तो उसके पास एक एप्लिकेशन होना चाहिए, जिसके माध्यम से DBMS को एक्सेस किया जा सके। प्रोग्रामर 2-स्तरीय वास्तुकला का उपयोग करते हैं जहां वे एक आवेदन के माध्यम से DBMS तक पहुंचते हैं। यहां ऑपरेशन, डिज़ाइन और प्रोग्रामिंग के संदर्भ में एप्लिकेशन टियर डेटाबेस से पूरी तरह से स्वतंत्र है।
3-स्तरीय वास्तुकला
3-स्तरीय वास्तुकला उपयोगकर्ताओं की जटिलता के आधार पर अपने स्तरों को एक दूसरे से अलग करती है और वे डेटाबेस में मौजूद डेटा का उपयोग कैसे करते हैं। यह एक DBMS डिजाइन करने के लिए सबसे व्यापक रूप से इस्तेमाल वास्तुकला है।
Database (Data) Tier- इस स्तर पर, डेटाबेस अपनी क्वेरी प्रोसेसिंग भाषाओं के साथ रहता है। हमारे संबंध भी हैं जो इस स्तर पर डेटा और उनकी बाधाओं को परिभाषित करते हैं।
Application (Middle) Tier- इस स्तर पर अनुप्रयोग सर्वर और डेटाबेस तक पहुँचने वाले प्रोग्रामों का निवास होता है। एक उपयोगकर्ता के लिए, यह एप्लिकेशन टियर डेटाबेस का सार दृश्य प्रस्तुत करता है। अंतिम-उपयोगकर्ता अनुप्रयोग से परे डेटाबेस के किसी भी अस्तित्व से अनजान हैं। दूसरे छोर पर, डेटाबेस टियर को एप्लिकेशन टियर से परे किसी अन्य उपयोगकर्ता के बारे में पता नहीं है। इसलिए, अनुप्रयोग परत मध्य में बैठती है और अंत-उपयोगकर्ता और डेटाबेस के बीच मध्यस्थ के रूप में कार्य करती है।
User (Presentation) Tier- एंड-यूजर्स इस टीयर पर काम करते हैं और उन्हें इस लेयर से परे डेटाबेस के किसी भी अस्तित्व के बारे में कुछ नहीं पता है। इस स्तर पर, डेटाबेस के कई दृश्य एप्लिकेशन द्वारा प्रदान किए जा सकते हैं। सभी विचार एप्लिकेशन टियर में रहने वाले अनुप्रयोगों द्वारा उत्पन्न होते हैं।
मल्टीपल टियर डेटाबेस आर्किटेक्चर अत्यधिक परिवर्तनशील है, क्योंकि इसके लगभग सभी घटक स्वतंत्र हैं और इन्हें स्वतंत्र रूप से बदला जा सकता है।
डेटा मॉडल यह परिभाषित करते हैं कि किसी डेटाबेस की तार्किक संरचना कैसे तैयार की जाती है। डेटा मॉडल एक डीबीएमएस में अमूर्तता का परिचय देने वाली मूलभूत संस्थाएँ हैं। डेटा मॉडल यह परिभाषित करते हैं कि डेटा एक दूसरे से कैसे जुड़ा हुआ है और सिस्टम के अंदर उन्हें कैसे संसाधित और संग्रहीत किया जाता है।
बहुत पहले डेटा मॉडल फ्लैट डेटा-मॉडल हो सकता है, जहां उपयोग किए जाने वाले सभी डेटा को एक ही विमान में रखा जाना है। पहले के डेटा मॉडल इतने वैज्ञानिक नहीं थे, इसलिए वे बहुत सारे दोहराव और विसंगतियों को पेश करने के लिए प्रवण थे।
इकाई-संबंध मॉडल
इकाई-संबंध (ईआर) मॉडल वास्तविक दुनिया की संस्थाओं और उनके बीच संबंधों की धारणा पर आधारित है। डेटाबेस मॉडल में वास्तविक दुनिया का परिदृश्य तैयार करते समय, ईआर मॉडल इकाई सेट, संबंध सेट, सामान्य विशेषताओं और बाधाओं को बनाता है।
ईआर मॉडल एक डेटाबेस के वैचारिक डिजाइन के लिए सबसे अच्छा उपयोग किया जाता है।
ईआर मॉडल पर आधारित है -
Entitiesऔर उनकी विशेषताएं।
Relationships संस्थाओं के बीच।
इन अवधारणाओं को नीचे समझाया गया है।
Entity - ईआर मॉडल में एक इकाई एक वास्तविक दुनिया की इकाई है जिसमें गुण होते हैं attributes। हर एकattribute मूल्यों के अपने सेट द्वारा परिभाषित किया गया है domain। उदाहरण के लिए, एक स्कूल डेटाबेस में, एक छात्र को एक इकाई माना जाता है। विद्यार्थी की विभिन्न विशेषताएँ होती हैं जैसे नाम, आयु, वर्ग इत्यादि।
Relationship - संस्थाओं के बीच तार्किक संघ कहा जाता है relationship। रिश्तों को विभिन्न तरीकों से संस्थाओं के साथ मैप किया जाता है। मानचित्रण कार्डिनैलिटी दो संस्थाओं के बीच जुड़ाव की संख्या को परिभाषित करती है।
कार्डिनैलिटी मैपिंग -
- एक से एक
- अनेको के लिये एक
- एक से कई
- कई कई
संबंधपरक मॉडल
DBMS में सबसे लोकप्रिय डेटा मॉडल रिलेशनल मॉडल है। यह दूसरों की तुलना में अधिक वैज्ञानिक मॉडल है। यह मॉडल प्रथम-क्रम तर्क पर आधारित है और एक तालिका को परिभाषित करता हैn-ary relation।
इस मॉडल के मुख्य आकर्षण हैं -
- डेटा तालिकाओं में संग्रहीत है relations।
- संबंधों को सामान्य किया जा सकता है।
- सामान्यीकृत संबंधों में, सहेजे गए मूल्य परमाणु मूल्य हैं।
- एक संबंध में प्रत्येक पंक्ति में एक अद्वितीय मूल्य होता है।
- किसी संबंध में प्रत्येक स्तंभ में एक ही डोमेन से मान होते हैं।
डेटाबेस स्कीमा
एक डेटाबेस स्कीमा कंकाल संरचना है जो पूरे डेटाबेस के तार्किक दृश्य का प्रतिनिधित्व करता है। यह परिभाषित करता है कि डेटा कैसे व्यवस्थित है और उनके बीच संबंध कैसे जुड़े हैं। यह उन सभी बाधाओं को तैयार करता है जिन्हें डेटा पर लागू किया जाना है।
एक डेटाबेस स्कीमा अपनी संस्थाओं और उनके बीच संबंधों को परिभाषित करता है। इसमें डेटाबेस का विवरणात्मक विवरण होता है, जिसे स्कीमा आरेख के माध्यम से दर्शाया जा सकता है। यह डेटाबेस डिज़ाइनर है जो प्रोग्रामर को डेटाबेस को समझने में मदद करने के लिए स्कीमा डिज़ाइन करते हैं और इसे उपयोगी बनाते हैं।
एक डेटाबेस स्कीमा को मोटे तौर पर दो श्रेणियों में विभाजित किया जा सकता है -
Physical Database Schema - यह स्कीमा डेटा के वास्तविक भंडारण और इसके भंडारण जैसे फ़ाइलों, सूचकांकों आदि से संबंधित है। यह परिभाषित करता है कि डेटा को द्वितीयक भंडारण में कैसे संग्रहीत किया जाएगा।
Logical Database Schema- यह स्कीमा उन सभी तार्किक बाधाओं को परिभाषित करता है जिन्हें संग्रहीत डेटा पर लागू करने की आवश्यकता होती है। यह तालिकाओं, विचारों और अखंडता बाधाओं को परिभाषित करता है।
डेटाबेस इंस्टेंस
यह महत्वपूर्ण है कि हम इन दो शब्दों को अलग-अलग रूप से परिभाषित करें। डेटाबेस स्कीमा डेटाबेस का कंकाल है। यह तब डिज़ाइन किया गया है जब डेटाबेस बिल्कुल मौजूद नहीं है। एक बार डेटाबेस चालू हो जाने के बाद, इसमें कोई भी बदलाव करना बहुत मुश्किल है। एक डेटाबेस स्कीमा में कोई डेटा या जानकारी नहीं होती है।
एक डेटाबेस उदाहरण किसी भी समय डेटा के साथ परिचालन डेटाबेस की एक स्थिति है। इसमें डेटाबेस का स्नैपशॉट है। डेटाबेस के उदाहरण समय के साथ बदलते हैं। एक DBMS यह सुनिश्चित करता है कि इसका हर उदाहरण (स्थिति) एक मान्य स्थिति में है, जो डेटाबेस के डिजाइनरों द्वारा लगाए गए सभी मान्यताओं, बाधाओं और शर्तों का पालन करते हुए।
यदि डेटाबेस सिस्टम बहुस्तरीय नहीं है, तो डेटाबेस सिस्टम में कोई भी बदलाव करना मुश्किल हो जाता है। डेटाबेस सिस्टम बहु-परतों में डिज़ाइन किए गए हैं जैसा कि हमने पहले सीखा था।
डेटा स्वतंत्रता
एक डेटाबेस सिस्टम में आमतौर पर उपयोगकर्ताओं के डेटा के अलावा बहुत अधिक डेटा होता है। उदाहरण के लिए, यह डेटा के बारे में डेटा संग्रहीत करता है, जिसे मेटाडेटा के रूप में जाना जाता है, आसानी से डेटा का पता लगाने और पुनर्प्राप्त करने के लिए। डेटाबेस में संग्रहीत होने के बाद मेटाडेटा के एक सेट को संशोधित या अपडेट करना मुश्किल है। लेकिन जैसा कि DBMS का विस्तार होता है, इसे उपयोगकर्ताओं की आवश्यकताओं को पूरा करने के लिए समय के साथ बदलना होगा। यदि पूरा डेटा निर्भर है, तो यह एक थकाऊ और अत्यधिक जटिल काम बन जाएगा।
मेटाडेटा स्वयं एक स्तरित वास्तुकला का अनुसरण करता है, ताकि जब हम एक परत पर डेटा बदलते हैं, तो यह दूसरे स्तर पर डेटा को प्रभावित नहीं करता है। यह डेटा स्वतंत्र है लेकिन एक दूसरे के लिए मैप किया गया है।
तार्किक डेटा स्वतंत्रता
लॉजिकल डेटा डेटाबेस के बारे में डेटा है, अर्थात, यह जानकारी संग्रहीत करता है कि डेटा को अंदर कैसे प्रबंधित किया जाता है। उदाहरण के लिए, डेटाबेस और उसके सभी बाधाओं में संग्रहीत एक तालिका (संबंध), उस संबंध पर लागू होती है।
तार्किक डेटा स्वतंत्रता एक तरह का तंत्र है, जो डिस्क पर संग्रहीत वास्तविक डेटा से खुद को उदार बनाता है। यदि हम टेबल फॉर्मेट में कुछ बदलाव करते हैं, तो उसे डिस्क पर रहने वाले डेटा को नहीं बदलना चाहिए।
भौतिक डेटा स्वतंत्रता
सभी स्कीमा तार्किक हैं, और वास्तविक डेटा डिस्क पर बिट प्रारूप में संग्रहीत किया जाता है। भौतिक डेटा स्वतंत्रता स्कीमा या तार्किक डेटा को प्रभावित किए बिना भौतिक डेटा को बदलने की शक्ति है।
उदाहरण के लिए, यदि हम स्टोरेज सिस्टम को स्वयं बदलना या अपग्रेड करना चाहते हैं - तो मान लें कि हम हार्ड डिस्क को एसएसडी के साथ बदलना चाहते हैं - इसका तार्किक डेटा या स्कीमा पर कोई प्रभाव नहीं होना चाहिए।
ईआर मॉडल एक डेटाबेस के वैचारिक दृष्टिकोण को परिभाषित करता है। यह वास्तविक दुनिया की संस्थाओं और उनके बीच संघों के आसपास काम करता है। व्यू स्तर पर, ईआर मॉडल को डेटाबेस डिजाइन करने के लिए एक अच्छा विकल्प माना जाता है।
सत्ता
एक इकाई एक वास्तविक दुनिया वस्तु हो सकती है, या तो चेतन या निर्जीव, जो आसानी से पहचानी जा सकती है। उदाहरण के लिए, एक स्कूल डेटाबेस में, छात्रों, शिक्षकों, कक्षाओं और पेश किए जाने वाले पाठ्यक्रमों को संस्थाओं के रूप में माना जा सकता है। इन सभी संस्थाओं में कुछ विशेषताएं या गुण हैं जो उन्हें अपनी पहचान देते हैं।
एक इकाई सेट समान प्रकार की संस्थाओं का एक संग्रह है। एक इकाई सेट में समान मान साझा करने की विशेषता वाली इकाइयाँ हो सकती हैं। उदाहरण के लिए, एक छात्र सेट में एक स्कूल के सभी छात्र शामिल हो सकते हैं; इसी तरह एक शिक्षक सेट में सभी संकायों के एक स्कूल के सभी शिक्षक शामिल हो सकते हैं। एंटिटी सेट की जरूरत नहीं है।
गुण
संस्थाओं को उनके गुणों के माध्यम से दर्शाया जाता है, जिन्हें कहा जाता है attributes। सभी विशेषताओं में मूल्य हैं। उदाहरण के लिए, एक छात्र इकाई में नाम, वर्ग और उम्र हो सकती है।
एक डोमेन या मानों की श्रेणी मौजूद है जिन्हें विशेषताओं को सौंपा जा सकता है। उदाहरण के लिए, एक छात्र का नाम संख्यात्मक मान नहीं हो सकता है। इसके लिए अल्फाबेटिक होना जरूरी है। एक छात्र की उम्र नकारात्मक नहीं हो सकती है, आदि।
गुण के प्रकार
Simple attribute- सरल गुण परमाणु मूल्य हैं, जिन्हें आगे विभाजित नहीं किया जा सकता है। उदाहरण के लिए, एक छात्र का फोन नंबर 10 अंकों का परमाणु मूल्य है।
Composite attribute- समग्र विशेषताएँ एक से अधिक सरल विशेषताओं से बनी होती हैं। उदाहरण के लिए, किसी छात्र का पूरा नाम पहले_नाम और अंतिम_नाम हो सकता है।
Derived attribute- व्युत्पन्न विशेषताएँ वे विशेषताएँ हैं जो भौतिक डेटाबेस में मौजूद नहीं हैं, लेकिन उनके मान डेटाबेस में मौजूद अन्य विशेषताओं से लिए गए हैं। उदाहरण के लिए, एक विभाग में औसत_सालरी को सीधे डेटाबेस में सहेजा नहीं जाना चाहिए, इसके बजाय इसे व्युत्पन्न किया जा सकता है। एक अन्य उदाहरण के लिए, उम्र data_of_birth से प्राप्त की जा सकती है।
Single-value attribute- एकल-मूल्य विशेषताओं में एकल मान होता है। उदाहरण के लिए - Social_Security_Number।
Multi-value attribute- बहु-मूल्य विशेषताओं में एक से अधिक मूल्य हो सकते हैं। उदाहरण के लिए, किसी व्यक्ति के पास एक से अधिक फ़ोन नंबर, email_address आदि हो सकते हैं।
ये विशेषता प्रकार एक साथ आ सकते हैं जैसे -
- सरल एकल-मूल्यवान विशेषताएँ
- सरल बहु-मूल्यवान विशेषताएँ
- समग्र एकल-मूल्यवान विशेषताएँ
- समग्र बहु-मूल्यवान विशेषताएँ
इकाई-सेट और कुंजी
की एक विशेषता या विशेषताओं का संग्रह है जो विशिष्ट रूप से इकाई सेट के बीच एक इकाई की पहचान करता है।
उदाहरण के लिए, एक छात्र का रोल_नंबर छात्रों के बीच उसकी पहचान बनाता है।
Super Key - विशेषताओं का एक सेट (एक या अधिक) जो सामूहिक रूप से एक इकाई सेट में एक इकाई की पहचान करता है।
Candidate Key- न्यूनतम सुपर कुंजी को उम्मीदवार कुंजी कहा जाता है। एक इकाई सेट में एक से अधिक उम्मीदवार कुंजी हो सकती है।
Primary Key - प्राथमिक कुंजी डेटाबेस डिजाइनर द्वारा विशिष्ट रूप से निर्धारित इकाई की पहचान करने के लिए चुने गए उम्मीदवार कुंजी में से एक है।
संबंध
संस्थाओं के बीच संबंध को एक संबंध कहा जाता है। उदाहरण के लिए, एक कर्मचारीworks_at एक विभाग, एक छात्र enrollsएक कोर्स में। यहाँ, Works_at और Enrolls को रिश्ते कहा जाता है।
संबंध सेट
समान प्रकार के रिश्तों के सेट को एक संबंध सेट कहा जाता है। संस्थाओं की तरह, एक रिश्ते में भी विशेषताएं हो सकती हैं। इन विशेषताओं को कहा जाता हैdescriptive attributes।
रिश्ते की डिग्री
एक रिश्ते में भाग लेने वाली संस्थाओं की संख्या रिश्ते की डिग्री को परिभाषित करती है।
- बाइनरी = डिग्री 2
- टर्नरी = डिग्री ३
- n-ary = डिग्री
कार्डिनैलिटी मैपिंग
Cardinality एक इकाई सेट में संस्थाओं की संख्या को परिभाषित करता है, जो संबंध सेट के माध्यम से अन्य सेट की संस्थाओं की संख्या से जुड़ा हो सकता है।
One-to-one - इकाई सेट A से एक इकाई B और इसके विपरीत इकाई सेट के अधिकांश एक इकाई से संबद्ध किया जा सकता है।
One-to-many - इकाई सेट से एक इकाई A को इकाई सेट B की एक से अधिक इकाइयों के साथ जोड़ा जा सकता है, हालांकि इकाई सेट B से एक इकाई, अधिकतम एक इकाई के साथ जुड़ा हो सकता है।
Many-to-one - इकाई सेट A से एक से अधिक संस्थाएँ, निकाय सेट B के अधिकांश एक इकाई से संबद्ध हो सकती हैं, हालांकि इकाई सेट B से एक इकाई, इकाई सेट A से एक से अधिक इकाइयों से संबद्ध हो सकती है।
Many-to-many - A की एक इकाई B से एक इकाई से जुड़ी हो सकती है और इसके विपरीत।
आइए अब जानें कि ईआर मॉडल को ईआर आरेख के माध्यम से कैसे दर्शाया जाता है। कोई भी वस्तु, उदाहरण के लिए, संस्थाएं, एक इकाई की विशेषताएँ, संबंध सेट, और संबंध सेट की विशेषताएँ, एक ईआर आरेख की सहायता से दर्शाई जा सकती हैं।
सत्ता
आयतों के माध्यम से संस्थाओं का प्रतिनिधित्व किया जाता है। रेक्टेंगल्स को उनके द्वारा निर्धारित इकाई सेट के साथ नामित किया जाता है।
गुण
विशेषताएँ संस्थाओं के गुण हैं। विशेषताओं को दीर्घवृत्त के माध्यम से दर्शाया जाता है। हर दीर्घवृत्त एक विशेषता का प्रतिनिधित्व करता है और सीधे इसकी इकाई (आयत) से जुड़ा होता है।
यदि विशेषताएँ हैं composite, वे आगे संरचना की तरह एक पेड़ में विभाजित हैं। प्रत्येक नोड तब इसकी विशेषता से जुड़ा होता है। यही है, मिश्रित विशेषताओं को दीर्घवृत्त के साथ दर्शाया जाता है जो एक दीर्घवृत्त से जुड़ा होता है।
Multivalued विशेषताओं को डबल दीर्घवृत्त द्वारा दर्शाया गया है।
Derived विशेषताओं को धराशायी दीर्घवृत्त द्वारा दर्शाया गया है।
संबंध
रिश्तों का प्रतिनिधित्व हीरे के आकार के बक्से द्वारा किया जाता है। रिश्ते का नाम डायमंड-बॉक्स के अंदर लिखा गया है। एक रिश्ते में भाग लेने वाली सभी इकाइयां (आयतें), एक लाइन द्वारा इससे जुड़ी हैं।
बाइनरी रिलेशनशिप और कार्डिनैलिटी
एक संबंध जहां दो संस्थाएं भाग ले रही हैं उसे कहा जाता है binary relationship। कार्डिनैलिटी एक संबंध से एक इकाई के उदाहरण की संख्या है जो संबंध के साथ जुड़ा हो सकता है।
One-to-one- जब किसी इकाई का केवल एक उदाहरण रिश्ते से जुड़ा होता है, तो उसे '1: 1' के रूप में चिह्नित किया जाता है। निम्न छवि दर्शाती है कि रिश्ते के साथ प्रत्येक इकाई का केवल एक उदाहरण जुड़ा होना चाहिए। इसमें एक-से-एक संबंधों को दर्शाया गया है।
One-to-many- जब किसी इकाई का एक से अधिक उदाहरण किसी रिश्ते से जुड़ा होता है, तो उसे '1: N' के रूप में चिह्नित किया जाता है। निम्नलिखित छवि दर्शाती है कि बाईं ओर इकाई का केवल एक उदाहरण और दाईं ओर एक इकाई का एक से अधिक उदाहरण रिश्ते से जुड़ा हो सकता है। इसमें एक-से-कई संबंधों को दर्शाया गया है।
Many-to-one- जब इकाई का एक से अधिक उदाहरण रिश्ते से जुड़ा होता है, तो इसे 'एन: 1' के रूप में चिह्नित किया जाता है। निम्न छवि दर्शाती है कि बाईं ओर एक इकाई का एक से अधिक उदाहरण और दाईं ओर एक इकाई का केवल एक उदाहरण रिश्ते से जुड़ा हो सकता है। इसमें कई रिश्तों को दर्शाया गया है।
Many-to-many- निम्नलिखित छवि दर्शाती है कि बाईं ओर एक इकाई का एक से अधिक उदाहरण और दाईं ओर एक इकाई का एक से अधिक उदाहरण रिश्ते से जुड़ा हो सकता है। इसमें कई-कई संबंधों को दर्शाया गया है।
भागीदारी की कमी
Total Participation- प्रत्येक इकाई रिश्ते में शामिल है। कुल भागीदारी को डबल लाइनों द्वारा दर्शाया गया है।
Partial participation- सभी संस्थाएं रिश्ते में शामिल नहीं हैं। आंशिक भागीदारी का प्रतिनिधित्व एकल लाइनों द्वारा किया जाता है।
आइए अब जानें कि ईआर मॉडल को ईआर आरेख के माध्यम से कैसे दर्शाया जाता है। कोई भी वस्तु, उदाहरण के लिए, संस्थाएं, एक इकाई की विशेषताएँ, संबंध सेट, और संबंध सेट की विशेषताएँ, एक ईआर आरेख की सहायता से दर्शाई जा सकती हैं।
सत्ता
आयतों के माध्यम से संस्थाओं का प्रतिनिधित्व किया जाता है। रेक्टेंगल्स को उनके द्वारा निर्धारित इकाई सेट के साथ नामित किया जाता है।
गुण
विशेषताएँ संस्थाओं के गुण हैं। विशेषताओं को दीर्घवृत्त के माध्यम से दर्शाया जाता है। हर दीर्घवृत्त एक विशेषता का प्रतिनिधित्व करता है और सीधे इसकी इकाई (आयत) से जुड़ा होता है।
यदि विशेषताएँ हैं composite, वे आगे संरचना की तरह एक पेड़ में विभाजित हैं। प्रत्येक नोड तब इसकी विशेषता से जुड़ा होता है। यही है, मिश्रित विशेषताओं को दीर्घवृत्त के साथ दर्शाया जाता है जो एक दीर्घवृत्त से जुड़ा होता है।
Multivalued विशेषताओं को डबल दीर्घवृत्त द्वारा दर्शाया गया है।
Derived विशेषताओं को धराशायी दीर्घवृत्त द्वारा दर्शाया गया है।
संबंध
रिश्तों का प्रतिनिधित्व हीरे के आकार के बक्से द्वारा किया जाता है। रिश्ते का नाम डायमंड-बॉक्स के अंदर लिखा गया है। एक रिश्ते में भाग लेने वाली सभी इकाइयां (आयतें), एक लाइन द्वारा इससे जुड़ी हैं।
बाइनरी रिलेशनशिप और कार्डिनैलिटी
एक संबंध जहां दो संस्थाएं भाग ले रही हैं उसे कहा जाता है binary relationship। कार्डिनैलिटी एक संबंध से एक इकाई के उदाहरण की संख्या है जो संबंध के साथ जुड़ा हो सकता है।
One-to-one- जब किसी इकाई का केवल एक उदाहरण रिश्ते से जुड़ा होता है, तो उसे '1: 1' के रूप में चिह्नित किया जाता है। निम्न छवि दर्शाती है कि रिश्ते के साथ प्रत्येक इकाई का केवल एक उदाहरण जुड़ा होना चाहिए। इसमें एक-से-एक संबंधों को दर्शाया गया है।
One-to-many- जब किसी इकाई का एक से अधिक उदाहरण किसी रिश्ते से जुड़ा होता है, तो उसे '1: N' के रूप में चिह्नित किया जाता है। निम्नलिखित छवि दर्शाती है कि बाईं ओर इकाई का केवल एक उदाहरण और दाईं ओर एक इकाई का एक से अधिक उदाहरण रिश्ते से जुड़ा हो सकता है। इसमें एक-से-कई संबंधों को दर्शाया गया है।
Many-to-one- जब इकाई का एक से अधिक उदाहरण रिश्ते से जुड़ा होता है, तो इसे 'एन: 1' के रूप में चिह्नित किया जाता है। निम्न छवि दर्शाती है कि बाईं ओर एक इकाई का एक से अधिक उदाहरण और दाईं ओर एक इकाई का केवल एक उदाहरण रिश्ते से जुड़ा हो सकता है। इसमें कई रिश्तों को दर्शाया गया है।
Many-to-many- निम्नलिखित छवि दर्शाती है कि बाईं ओर एक इकाई का एक से अधिक उदाहरण और दाईं ओर एक इकाई का एक से अधिक उदाहरण रिश्ते से जुड़ा हो सकता है। इसमें कई-कई संबंधों को दर्शाया गया है।
भागीदारी की कमी
Total Participation- प्रत्येक इकाई रिश्ते में शामिल है। कुल भागीदारी को डबल लाइनों द्वारा दर्शाया गया है।
Partial participation- सभी संस्थाएं रिश्ते में शामिल नहीं हैं। आंशिक भागीदारी का प्रतिनिधित्व एकल लाइनों द्वारा किया जाता है।
ईआर मॉडल में वैचारिक श्रेणीबद्ध तरीके से डेटाबेस संस्थाओं को व्यक्त करने की शक्ति है। जैसा कि पदानुक्रम ऊपर जाता है, यह संस्थाओं के दृष्टिकोण को सामान्य करता है, और जैसा कि हम पदानुक्रम में गहराई से जाते हैं, यह हमें शामिल की गई प्रत्येक इकाई का विवरण देता है।
इस संरचना में ऊपर जाने को कहा जाता है generalization, जहां संस्थाओं को एक अधिक सामान्यीकृत दृश्य का प्रतिनिधित्व करने के लिए एक साथ क्लब किया जाता है। उदाहरण के लिए, मीरा नामक एक विशेष छात्र को सभी छात्रों के साथ सामान्यीकृत किया जा सकता है। इकाई एक छात्र होगी, और आगे, छात्र एक व्यक्ति है। रिवर्स कहा जाता हैspecialization जहां एक व्यक्ति एक छात्र है, और वह छात्र मीरा है।
सामान्यकरण
जैसा कि ऊपर उल्लेख किया गया है, संस्थाओं को सामान्य करने की प्रक्रिया, जहां सामान्यीकृत संस्थाओं में सभी सामान्यीकृत संस्थाओं के गुण होते हैं, सामान्यीकरण कहलाते हैं। सामान्यीकरण में, कई संस्थाओं को उनकी समान विशेषताओं के आधार पर एक सामान्यीकृत इकाई में एक साथ लाया जाता है। उदाहरण के लिए, कबूतर, घर गौरैया, कौआ और कबूतर सभी को पक्षी के रूप में सामान्यीकृत किया जा सकता है।
विशेषज्ञता
विशेषज्ञता सामान्यीकरण के विपरीत है। विशेषज्ञता में, संस्थाओं के एक समूह को उनकी विशेषताओं के आधार पर उप-समूहों में विभाजित किया जाता है। उदाहरण के लिए एक समूह 'व्यक्ति' लीजिए। एक व्यक्ति का नाम, जन्म तिथि, लिंग आदि हैं। ये गुण सभी व्यक्तियों, मनुष्यों में आम हैं। लेकिन एक कंपनी में, व्यक्तियों को कर्मचारी, नियोक्ता, ग्राहक या विक्रेता के रूप में पहचाना जा सकता है, जो कंपनी में उनकी भूमिका के आधार पर होता है।
इसी तरह, एक स्कूल डेटाबेस में, व्यक्तियों को शिक्षक, छात्र या कर्मचारी के रूप में विशेष किया जा सकता है, जो कि वे संस्थाओं के रूप में स्कूल में क्या भूमिका निभाते हैं।
विरासत
हम ऑब्जेक्ट-ओरिएंटेड प्रोग्रामिंग में ऑब्जेक्ट्स की कक्षाएं बनाने के लिए ईआर-मॉडल की सभी उपरोक्त सुविधाओं का उपयोग करते हैं। संस्थाओं का विवरण आम तौर पर उपयोगकर्ता से छिपाया जाता है; इस प्रक्रिया के रूप में जाना जाता हैabstraction।
वंशानुक्रम सामान्यीकरण और विशेषज्ञता की एक महत्वपूर्ण विशेषता है। यह निम्न-स्तरीय संस्थाओं को उच्च-स्तरीय संस्थाओं की विशेषताओं को प्राप्त करने की अनुमति देता है।
उदाहरण के लिए, व्यक्ति या शिक्षक जैसे निचले स्तर की संस्थाओं द्वारा एक व्यक्तिगत वर्ग के नाम, आयु और लिंग के गुण विरासत में प्राप्त किए जा सकते हैं।
डॉ। एडगर एफ। कोडड, डेटाबेस सिस्टम के रिलेशनल मॉडल पर अपने व्यापक शोध के बाद, अपने स्वयं के बारह नियमों के साथ आए, जो उनके अनुसार, एक डेटाबेस को एक सच्चे रिलेशनल डेटाबेस के रूप में माना जाना चाहिए।
इन नियमों को किसी भी डेटाबेस सिस्टम पर लागू किया जा सकता है जो केवल अपनी रिलेशनल क्षमताओं का उपयोग करके संग्रहीत डेटा का प्रबंधन करता है। यह एक नींव नियम है, जो अन्य सभी नियमों के आधार के रूप में कार्य करता है।
नियम 1: सूचना नियम
एक डेटाबेस में संग्रहीत डेटा, यह उपयोगकर्ता डेटा या मेटाडेटा हो सकता है, कुछ टेबल सेल का मान होना चाहिए। एक डेटाबेस में सब कुछ एक तालिका प्रारूप में संग्रहीत किया जाना चाहिए।
नियम 2: गारंटी नियम
हर एक डेटा तत्व (मूल्य) को तालिका-नाम, प्राथमिक-कुंजी (पंक्ति मूल्य), और विशेषता-नाम (स्तंभ मान) के संयोजन के साथ तार्किक रूप से सुलभ होने की गारंटी है। कोई अन्य साधन, जैसे कि पॉइंटर्स, का उपयोग डेटा तक पहुंचने के लिए किया जा सकता है।
नियम 3: पूर्ण मानों का व्यवस्थित उपचार
एक डेटाबेस में NULL मान को एक व्यवस्थित और समान उपचार दिया जाना चाहिए। यह एक बहुत ही महत्वपूर्ण नियम है क्योंकि किसी NULL की व्याख्या निम्न के रूप में की जा सकती है - डेटा गायब है, डेटा ज्ञात नहीं है, या डेटा लागू नहीं है।
नियम 4: सक्रिय ऑनलाइन कैटलॉग
पूरे डेटाबेस का संरचना विवरण एक ऑनलाइन कैटलॉग में संग्रहीत किया जाना चाहिए, जिसे कहा जाता है data dictionary, जो अधिकृत उपयोगकर्ताओं द्वारा पहुँचा जा सकता है। उपयोगकर्ता कैटलॉग तक पहुंचने के लिए उसी क्वेरी भाषा का उपयोग कर सकते हैं, जिसका उपयोग वे डेटाबेस तक पहुंचने के लिए करते हैं।
नियम 5: व्यापक डेटा उप-भाषा नियम
एक डेटाबेस को केवल रैखिक वाक्यविन्यास वाली भाषा का उपयोग करके एक्सेस किया जा सकता है जो डेटा परिभाषा, डेटा हेरफेर और लेनदेन प्रबंधन संचालन का समर्थन करता है। इस भाषा का उपयोग सीधे या कुछ एप्लिकेशन के माध्यम से किया जा सकता है। यदि डेटाबेस इस भाषा की सहायता के बिना डेटा तक पहुंच की अनुमति देता है, तो इसे उल्लंघन माना जाता है।
नियम 6: अद्यतन नियम देखें
एक डेटाबेस के सभी विचार, जो सैद्धांतिक रूप से अपडेट किए जा सकते हैं, सिस्टम द्वारा भी अद्यतन होना चाहिए।
नियम 7: हाई-लेवल इंसर्ट, अपडेट और डिलीट रूल
एक डेटाबेस को उच्च-स्तरीय सम्मिलन, अपडेशन और विलोपन का समर्थन करना चाहिए। यह केवल एक पंक्ति तक सीमित नहीं होना चाहिए, अर्थात, यह डेटा रिकॉर्ड के सेट के लिए यूनियन, चौराहे और माइनस संचालन का भी समर्थन करना चाहिए।
नियम 8: भौतिक डेटा स्वतंत्रता
एक डेटाबेस में संग्रहीत डेटा डेटाबेस तक पहुंचने वाले अनुप्रयोगों से स्वतंत्र होना चाहिए। डेटाबेस की भौतिक संरचना में किसी भी परिवर्तन का बाहरी अनुप्रयोगों द्वारा डेटा तक पहुंचने का कोई प्रभाव नहीं होना चाहिए।
नियम 9: तार्किक डेटा स्वतंत्रता
एक डेटाबेस में तार्किक डेटा उसके उपयोगकर्ता के दृश्य (एप्लिकेशन) से स्वतंत्र होना चाहिए। तार्किक डेटा में किसी भी परिवर्तन का उपयोग करने वाले अनुप्रयोगों को प्रभावित नहीं करना चाहिए। उदाहरण के लिए, यदि दो तालिकाओं को मिला दिया जाता है या एक को दो अलग-अलग तालिकाओं में विभाजित किया जाता है, तो उपयोगकर्ता अनुप्रयोग पर कोई प्रभाव या परिवर्तन नहीं होना चाहिए। यह लागू करने के लिए सबसे कठिन नियम में से एक है।
नियम 10: अखंडता की स्वतंत्रता
एक डेटाबेस उस एप्लिकेशन से स्वतंत्र होना चाहिए जो इसका उपयोग करता है। एप्लिकेशन में किसी भी बदलाव की आवश्यकता के बिना इसकी सभी अखंडता बाधाओं को स्वतंत्र रूप से संशोधित किया जा सकता है। यह नियम एक डेटाबेस को फ्रंट-एंड एप्लिकेशन और उसके इंटरफेस से स्वतंत्र बनाता है।
नियम 11: वितरण स्वतंत्रता
अंत-उपयोगकर्ता को यह देखने में सक्षम नहीं होना चाहिए कि डेटा विभिन्न स्थानों पर वितरित किया गया है। उपयोगकर्ताओं को हमेशा यह धारणा मिलनी चाहिए कि डेटा केवल एक साइट पर स्थित है। इस नियम को वितरित डेटाबेस सिस्टम की नींव के रूप में माना गया है।
नियम 12: गैर-तोड़फोड़ नियम
यदि किसी सिस्टम में एक इंटरफ़ेस है जो निम्न-स्तरीय रिकॉर्ड तक पहुंच प्रदान करता है, तो इंटरफ़ेस को सिस्टम को हटाने और सुरक्षा और अखंडता बाधाओं को बायपास करने में सक्षम नहीं होना चाहिए।
संबंधपरक डेटा मॉडल प्राथमिक डेटा मॉडल है, जो डेटा भंडारण और प्रसंस्करण के लिए दुनिया भर में व्यापक रूप से उपयोग किया जाता है। यह मॉडल सरल है और इसमें भंडारण दक्षता के साथ डेटा को संसाधित करने के लिए आवश्यक सभी गुण और क्षमताएं हैं।
अवधारणाओं
Tables- संबंधपरक डेटा मॉडल में, संबंध टेबल्स के प्रारूप में सहेजे जाते हैं। यह प्रारूप संस्थाओं के बीच संबंध को संग्रहीत करता है। एक तालिका में पंक्तियाँ और स्तंभ हैं, जहाँ पंक्तियाँ अभिलेखों का प्रतिनिधित्व करती हैं और स्तंभ विशेषताओं का प्रतिनिधित्व करते हैं।
Tuple - एक तालिका की एक पंक्ति, जिसमें उस संबंध के लिए एक एकल रिकॉर्ड होता है, जिसे टुप कहा जाता है।
Relation instance- रिलेशनल डेटाबेस सिस्टम में ट्यूपल्स का एक सीमित सेट रिलेशन इंस्टेंस को दर्शाता है। संबंध उदाहरण डुप्लिकेट tuples नहीं है।
Relation schema - एक संबंध स्कीमा संबंध नाम (तालिका नाम), गुण और उनके नामों का वर्णन करता है।
Relation key - प्रत्येक पंक्ति में एक या एक से अधिक गुण होते हैं, जिन्हें संबंध कुंजी के रूप में जाना जाता है, जो संबंध (तालिका) में पंक्ति को विशिष्ट रूप से पहचान सकते हैं।
Attribute domain - प्रत्येक विशेषता में कुछ पूर्व-परिभाषित मूल्य क्षेत्र होते हैं, जिन्हें विशेषता डोमेन के रूप में जाना जाता है।
प्रतिबन्ध
हर रिश्ते की कुछ शर्तें होती हैं जो एक वैध संबंध होने के लिए होनी चाहिए। इन स्थितियों को कहा जाता हैRelational Integrity Constraints। तीन मुख्य अखंडता बाधाएं हैं -
- मुख्य बाधाओं
- डोमेन की कमी
- अधिमान्य अखंडता बाधाओं
मुख्य बाधाओं
संबंध में विशेषताओं का कम से कम एक न्यूनतम उपसमुच्चय होना चाहिए, जो विशिष्ट रूप से एक नलिका की पहचान कर सकता है। विशेषताओं का यह न्यूनतम सबसेट कहा जाता हैkeyउस संबंध के लिए। यदि एक से अधिक ऐसे न्यूनतम उपसमुच्चय हैं, तो इन्हें कहा जाता हैcandidate keys।
प्रमुख बाधाओं ने बल दिया कि -
एक प्रमुख विशेषता के संबंध में, कोई भी दो ट्यूपल कुंजी विशेषताओं के समान मूल्य नहीं रख सकते हैं।
एक मुख्य विशेषता में NULL मान नहीं हो सकते।
मुख्य बाधाओं को भी इकाई बाधाओं के रूप में जाना जाता है।
डोमेन की कमी
वास्तविक दुनिया के परिदृश्य में विशेषताओं के विशिष्ट मूल्य हैं। उदाहरण के लिए, आयु केवल एक सकारात्मक पूर्णांक हो सकती है। समान बाधाओं को एक संबंध की विशेषताओं पर नियोजित करने की कोशिश की गई है। प्रत्येक विशेषता मानों की एक विशिष्ट श्रेणी के लिए बाध्य है। उदाहरण के लिए, आयु शून्य से कम नहीं हो सकती है और टेलीफोन नंबरों में 0-9 के बाहर एक अंक नहीं हो सकता है।
संदर्भात्मक अखंडता की कमी
रेफ़रेंशियल अखंडता विदेशी कुंजी की अवधारणा पर काम करती है। एक विदेशी कुंजी एक संबंध की एक प्रमुख विशेषता है जिसे अन्य संबंध में संदर्भित किया जा सकता है।
संदर्भात्मक अखंडता बाधा कहती है कि यदि एक संबंध एक अलग या समान संबंध की एक प्रमुख विशेषता को संदर्भित करता है, तो उस महत्वपूर्ण तत्व का अस्तित्व होना चाहिए।
रिलेशनल डेटाबेस सिस्टम एक क्वेरी भाषा से लैस होने की उम्मीद करते हैं जो अपने उपयोगकर्ताओं को डेटाबेस इंस्टेंसेस को क्वेरी करने में सहायता कर सकती है। दो प्रकार की क्वेरी भाषाएँ हैं - संबंधपरक बीजगणित और संबंधपरक कलन।
संबंधपरक बीजगणित
संबंधपरक बीजगणित एक प्रक्रियात्मक क्वेरी भाषा है, जो संबंधों के उदाहरणों को इनपुट के रूप में लेती है और आउटपुट के रूप में संबंधों के उदाहरणों को जन्म देती है। यह प्रश्नों को करने के लिए ऑपरेटरों का उपयोग करता है। एक ऑपरेटर भी हो सकता हैunary या binary। वे अपने इनपुट के रूप में संबंधों को स्वीकार करते हैं और अपने आउटपुट के रूप में संबंधों को उपजते हैं। संबंधिक बीजगणित को एक संबंध पर पुनरावर्ती रूप से किया जाता है और मध्यवर्ती परिणामों को भी संबंध माना जाता है।
संबंधपरक बीजगणित के मूलभूत संचालन इस प्रकार हैं -
- Select
- Project
- Union
- अलग सेट करें
- कार्तीय गुणन
- Rename
हम निम्नलिखित अनुभागों में इन सभी कार्यों पर चर्चा करेंगे।
ऑपरेशन का चयन करें (σ)
यह ट्यूपल्स का चयन करता है जो किसी संबंध से दिए गए विधेय को संतुष्ट करते हैं।
Notation- r पी (आर)
कहाँ पे σ चयन के लिए खड़ा है विधेय और rसंबंध के लिए खड़ा है। p प्रीपोजिशन लॉजिक फॉर्मूला है जिसमें कनेक्टर जैसे का उपयोग किया जा सकता हैand, or, तथा not। ये शब्द संबंधित ऑपरेटरों जैसे - =, ational, <, <,>, ≠ का उपयोग कर सकते हैं।
For example -
σsubject="database"(Books)
Output - उन पुस्तकों से ट्यूपल्स का चयन करता है जहां विषय 'डेटाबेस' है।
σsubject="database" and price="450"(Books)
Output - उन पुस्तकों से ट्यूपल्स का चयन करता है जहां विषय 'डेटाबेस' और 'मूल्य' 450 है।
σsubject="database" and price < "450" or year > "2010"(Books)
Output - उन पुस्तकों से ट्यूपल्स का चयन करता है जहां विषय 'डेटाबेस' और 'मूल्य' 450 है या 2010 के बाद प्रकाशित किताबें हैं।
परियोजना संचालन (∏)
यह कॉलम (एस) को प्रोजेक्ट करता है जो किसी दिए गए विधेय को संतुष्ट करता है।
संकेतन - ation A 1 , A 2 , A n (r)
जहाँ A 1 , A 2 , A n विशेषता संबंध के नाम हैंr।
डुप्लिकेट पंक्तियों को स्वचालित रूप से समाप्त कर दिया जाता है, क्योंकि संबंध एक सेट है।
For example -
∏subject, author (Books)
संबंध पुस्तकों से विषय और लेखक के रूप में चयनित कॉलम और प्रोजेक्ट।
यूनियन ऑपरेशन (∪)
यह दो दिए गए संबंधों के बीच द्विआधारी संघ का कार्य करता है और इसे इस प्रकार परिभाषित किया जाता है -
r ∪ s = { t | t ∈ r or t ∈ s}
Notation - आर यू एस
कहाँ पे r तथा s या तो डेटाबेस संबंध या संबंध परिणाम सेट (अस्थायी संबंध) हैं।
संघ संचालन मान्य होने के लिए, निम्नलिखित शर्तें रखनी होंगी -
- r, तथा s विशेषताओं की समान संख्या होनी चाहिए।
- विशेषता डोमेन संगत होना चाहिए।
- डुप्लिकेट टुपल्स स्वचालित रूप से समाप्त हो जाते हैं।
∏ author (Books) ∪ ∏ author (Articles)
Output - उन लेखकों के नामों को प्रोजेक्ट करता है जिन्होंने या तो एक किताब या एक लेख या दोनों लिखा है।
सेट अंतर (-)
सेट अंतर ऑपरेशन का परिणाम ट्यूपल्स हैं, जो एक संबंध में मौजूद हैं, लेकिन दूसरे संबंध में नहीं हैं।
Notation - r - s
में मौजूद सभी tuples को ढूँढता है r लेकिन में नहीं s।
∏ author (Books) − ∏ author (Articles)
Output - उन लेखकों का नाम प्रदान करता है जिन्होंने किताबें लिखी हैं, लेकिन लेख नहीं।
कार्टेशियन उत्पाद (Χ)
दो अलग-अलग संबंधों की जानकारी को एक में जोड़ता है।
Notation - आर Χ एस
कहाँ पे r तथा s संबंध हैं और उनके उत्पादन को इस प्रकार परिभाषित किया जाएगा -
r r s = {qt | q q r और t} s}
∏ author = 'tutorialspoint'(Books Χ Articles)
Output - एक संबंध देता है, जो सभी पुस्तकों और लेखों को ट्यूटोरियलस्पॉट द्वारा लिखा गया है।
नाम बदलें ऑपरेशन (ρ)
संबंधपरक बीजगणित के परिणाम भी संबंध हैं लेकिन बिना किसी नाम के। नाम बदलने का संचालन हमें आउटपुट संबंध का नाम बदलने की अनुमति देता है। 'नाम बदलने' का संचालन छोटे ग्रीक अक्षर के साथ किया जाता हैrho ρ ।
Notation- एल एक्स (ई)
जहां अभिव्यक्ति का परिणाम है E के नाम से सहेजा गया है x।
अतिरिक्त ऑपरेशन हैं -
- चौराहा सेट करें
- Assignment
- प्राकृतिक जुड़ाव
संबंधपरक कलन
संबंधपरक बीजगणित के विपरीत, रिलेशनल कैलकुलस एक गैर-प्रक्रियात्मक क्वेरी भाषा है, अर्थात यह बताती है कि क्या करना है लेकिन यह कभी नहीं समझाता है कि यह कैसे करना है।
संबंधपरक कलन दो रूपों में मौजूद है -
टपल रिलेशनल कैलकुलस (TRC)
टुपल्स के ऊपर चर श्रेणियों को फ़िल्टर करना
Notation- {टी | स्थिति}
सभी tuples T को लौटाता है जो एक स्थिति को संतुष्ट करता है।
For example -
{ T.name | Author(T) AND T.article = 'database' }
Output - लेखक से 'नाम' के साथ ट्यूपल्स लौटाता है, जिसने 'डेटाबेस' पर लेख लिखा है।
टीआरसी की मात्रा निर्धारित की जा सकती है। हम Existential (∃) और यूनिवर्सल क्वांटिफायर (।) का उपयोग कर सकते हैं।
For example -
{ R| ∃T ∈ Authors(T.article='database' AND R.name=T.name)}
Output - उपरोक्त क्वेरी पिछले वाले के समान परिणाम देगी।
डोमेन रिलेशनल कैलकुलस (DRC)
DRC में, फ़िल्टरिंग चर संपूर्ण टुपल मानों के बजाय विशेषताओं के डोमेन का उपयोग करता है (जैसा कि ऊपर उल्लेखित TRC में किया गया है)।
Notation -
{ 1 , 2 , 3 , ..., ए एन | पी (एक 1 , एक 2 , एक 3 , ..., एक एन )}
जहाँ a1, a2 विशेषताएँ और हैं P आंतरिक विशेषताओं द्वारा निर्मित सूत्रों के लिए खड़ा है।
For example -
{< article, page, subject > |
∈ TutorialsPoint ∧ subject = 'database'}
Output - लेख, पृष्ठ, और संबंध ट्यूटोरियलसेपॉइंट से उपज, जहां विषय डेटाबेस है।
टीआरसी की तरह, डीआरसी को अस्तित्व और सार्वभौमिक क्वांटिफायर का उपयोग करके भी लिखा जा सकता है। DRC में रिलेशनल ऑपरेटर भी शामिल हैं।
टपल रिलेशन कैलकुलस और डोमेन रिलेशन कैलकुलस की अभिव्यक्ति शक्ति रिलेशनल बीजगणित के बराबर है।
ईआर मॉडल, जब आरेख में अवधारणा, इकाई-संबंध का एक अच्छा अवलोकन देता है, जिसे समझना आसान है। ईआर आरेखों को संबंधपरक स्कीमा में मैप किया जा सकता है, अर्थात, ईआर आरेख का उपयोग करके संबंधपरक स्कीमा बनाना संभव है। हम संबंध मॉडल में सभी ईआर बाधाओं को आयात नहीं कर सकते हैं, लेकिन एक अनुमानित स्कीमा उत्पन्न की जा सकती है।
ईआर डायग्राम को संबंधपरक स्कीमा में बदलने के लिए कई प्रक्रियाएं और एल्गोरिदम उपलब्ध हैं। उनमें से कुछ स्वचालित हैं और उनमें से कुछ मैनुअल हैं। हम यहां मैपिंग आरेख सामग्री से संबंधपरक मूल बातें पर ध्यान केंद्रित कर सकते हैं।
ईआर आरेख मुख्य रूप से शामिल हैं -
- इकाई और उसके गुण
- संबंध, जो संस्थाओं के बीच संबंध है।
मानचित्रण इकाई
एक इकाई कुछ विशेषताओं के साथ एक वास्तविक दुनिया की वस्तु है।
मानचित्रण प्रक्रिया (एल्गोरिथम)
- प्रत्येक इकाई के लिए तालिका बनाएं।
- इकाई के गुण उनके संबंधित डेटा प्रकारों के साथ तालिकाओं के क्षेत्र बनने चाहिए।
- प्राथमिक कुंजी घोषित करें।
मानचित्रण संबंध
एक संबंध संस्थाओं के बीच एक संबंध है।
मानचित्रण प्रक्रिया
- रिश्ते के लिए टेबल बनाएं।
- सभी संबंधित संस्थाओं की प्राथमिक कुंजियों को उनके संबंधित डेटा प्रकारों के साथ तालिका के क्षेत्रों के रूप में जोड़ें।
- यदि संबंध में कोई विशेषता है, तो प्रत्येक विशेषता को तालिका के क्षेत्र के रूप में जोड़ें।
- भाग लेने वाली संस्थाओं की सभी प्राथमिक कुंजियों की रचना करने वाली एक प्राथमिक कुंजी घोषित करें।
- सभी विदेशी प्रमुख बाधाओं की घोषणा करें।
मैपिंग कमजोर इकाई सेट
एक कमजोर इकाई सेट वह है जिसके पास कोई भी प्राथमिक कुंजी नहीं होती है।
मानचित्रण प्रक्रिया
- कमजोर इकाई सेट के लिए तालिका बनाएं।
- फ़ील्ड के रूप में तालिका में इसके सभी गुण जोड़ें।
- इकाई सेट की पहचान की प्राथमिक कुंजी जोड़ें।
- सभी विदेशी प्रमुख बाधाओं की घोषणा करें।
मैपिंग पदानुक्रमिक संस्थाओं
ईआर विशेषज्ञता या सामान्यीकरण पदानुक्रमित इकाई सेट के रूप में आता है।
मानचित्रण प्रक्रिया
सभी उच्च-स्तरीय संस्थाओं के लिए तालिकाएँ बनाएँ।
निम्न-स्तरीय संस्थाओं के लिए तालिकाएँ बनाएँ।
निम्न-स्तरीय संस्थाओं की तालिका में उच्च-स्तरीय संस्थाओं की प्राथमिक कुंजियाँ जोड़ें।
निचले स्तर की तालिकाओं में, निचले स्तर की संस्थाओं की अन्य सभी विशेषताओं को जोड़ें।
उच्च-स्तरीय तालिका की प्राथमिक कुंजी और निम्न-स्तरीय तालिका के लिए प्राथमिक कुंजी की घोषणा करें।
विदेशी प्रमुख बाधाओं की घोषणा करें।
SQL रिलेशनल डेटाबेस के लिए एक प्रोग्रामिंग भाषा है। इसे रिलेशनल अलजेब्रा और टपल रिलेशनल कैलकुलस के ऊपर बनाया गया है। SQL RDBMS के सभी प्रमुख वितरण के साथ एक पैकेज के रूप में आता है।
SQL में डेटा डेफिनेशन और डेटा मैनिपुलेशन भाषाओं दोनों शामिल हैं। SQL की डेटा परिभाषा गुणों का उपयोग करके, कोई व्यक्ति डेटाबेस स्कीमा को डिज़ाइन और संशोधित कर सकता है, जबकि डेटा हेरफेर गुण SQL को डेटाबेस से डेटा संग्रहीत और पुनर्प्राप्त करने की अनुमति देता है।
डेटा परिभाषा भाषा
SQL डेटाबेस स्कीमा को परिभाषित करने के लिए कमांड के निम्नलिखित सेट का उपयोग करता है -
सृजन करना
RDBMS से नए डेटाबेस, टेबल और विचार बनाता है।
For example -
Create database tutorialspoint;
Create table article;
Create view for_students;
ड्रॉप
RDBMS से कमांड, व्यू, टेबल और डेटाबेस को ड्राप करता है।
For example-
Drop object_type object_name;
Drop database tutorialspoint;
Drop table article;
Drop view for_students;
बदलने
डेटाबेस स्कीमा को संशोधित करता है।
Alter object_type object_name parameters;
For example-
Alter table article add subject varchar;
यह कमांड रिलेशन में एक विशेषता जोड़ता है article नाम के साथ subject स्ट्रिंग प्रकार का।
डेटा हेरफेर भाषा
एसक्यूएल डेटा हेरफेर भाषा (डीएमएल) से लैस है। डीएमएल अपने डेटा को डालने, अद्यतन करने और हटाने के द्वारा डेटाबेस उदाहरण को संशोधित करता है। डीएमएल एक डेटाबेस में सभी रूपों डेटा संशोधन के लिए जिम्मेदार है। SQL में अपने DML सेक्शन में कमांड्स के निम्नलिखित सेट होते हैं -
- SELECT/FROM/WHERE
- INSERT INTO / मूल्य
- UPDATE/SET/WHERE
- DELETE FROM / WHERE
ये मूल निर्माण डेटाबेस प्रोग्रामर और उपयोगकर्ताओं को डेटाबेस में डेटा और जानकारी दर्ज करने और कई फ़िल्टर विकल्पों का उपयोग करके कुशलतापूर्वक पुनर्प्राप्त करने की अनुमति देते हैं।
का चयन करें / से कहां /
SELECT- यह SQL की मौलिक क्वेरी कमांड में से एक है। यह रिलेशनल बीजगणित के प्रक्षेपण संचालन के समान है। यह WHERE क्लॉज द्वारा वर्णित शर्त के आधार पर विशेषताओं का चयन करता है।
FROM- यह क्लॉज एक रिलेशन का नाम एक तर्क के रूप में लेता है जिसमें से विशेषताओं का चयन / प्रोजेक्ट किया जाना है। यदि एक से अधिक संबंध नाम दिए गए हैं, तो यह खंड कार्टेशियन उत्पाद से मेल खाता है।
WHERE - यह खंड विधेय या शर्तों को परिभाषित करता है, जिसे प्रोजेक्ट किए जाने वाले गुणों को प्राप्त करने के लिए मेल खाना चाहिए।
For example -
Select author_name
From book_author
Where age > 50;
यह कमांड रिलेशन से लेखकों के नाम का उत्पादन करेगा book_author जिनकी उम्र 50 से अधिक है।
INSERT INTO / मूल्य
इस कमांड का उपयोग किसी तालिका (संबंध) की पंक्तियों में मान डालने के लिए किया जाता है।
Syntax-
INSERT INTO table (column1 [, column2, column3 ... ]) VALUES (value1 [, value2, value3 ... ])
या
INSERT INTO table VALUES (value1, [value2, ... ])
For example -
INSERT INTO tutorialspoint (Author, Subject) VALUES ("anonymous", "computers");
अद्यतन / सेट / कहां
इस कमांड का उपयोग किसी तालिका (संबंध) में स्तंभों के मानों को अद्यतन या संशोधित करने के लिए किया जाता है।
Syntax -
UPDATE table_name SET column_name = value [, column_name = value ...] [WHERE condition]
For example -
UPDATE tutorialspoint SET Author="webmaster" WHERE Author="anonymous";
/ कहां से हटाएँ /
इस कमांड का उपयोग एक तालिका (संबंध) से एक या अधिक पंक्तियों को हटाने के लिए किया जाता है।
Syntax -
DELETE FROM table_name [WHERE condition];
For example -
DELETE FROM tutorialspoints
WHERE Author="unknown";
कार्यात्मक निर्भरता
कार्यात्मक निर्भरता (एफडी) एक संबंध में दो विशेषताओं के बीच बाधाओं का एक सेट है। कार्यात्मक निर्भरता कहती है कि यदि दो टुपल्स में ए 1, ए 2, ..., एएन के लिए समान मान हैं, तो उन दो टुपल्स के पास बी 1, बी 2, ..., बीएन विशेषताओं के लिए समान मान होना चाहिए।
कार्यात्मक निर्भरता को एक तीर के चिन्ह (→) से दर्शाया गया है, जो कि X → Y है, जहाँ X कार्यात्मक रूप से Y को निर्धारित करता है। बाएँ-हाथ की विशेषताएँ दाईं ओर की विशेषताओं के मूल्यों को निर्धारित करती हैं।
आर्मस्ट्रॉन्ग के एज़ियम्स
यदि F कार्यात्मक निर्भरता का एक सेट है, तो F का बन्द होना, जिसे F + के रूप में निरूपित किया जाता है , F. आर्मस्ट्रांग के Axioms द्वारा तार्किक रूप से निहित सभी कार्यात्मक निर्भरताओं का एक सेट है, जो कि बार-बार लागू होने पर, कार्यात्मक निर्भरता के बंद होने को उत्पन्न करता है। ।
Reflexive rule - यदि अल्फा गुण का एक सेट है और बीटा is_subset_of अल्फा है, तो अल्फा बीटा धारण करता है।
Augmentation rule- यदि a → b होल्ड और y विशेषता सेट है, तो ay → भी धारण करता है। यह निर्भरता में विशेषताएँ जोड़ रहा है, मूल निर्भरता को नहीं बदलता है।
Transitivity rule- बीजगणित में सकर्मक नियम के समान, यदि a → b होल्ड और b → c होल्ड है, तो a → c भी धारण करता है। a → b को कार्यात्मक रूप से कहा जाता है जो b को निर्धारित करता है।
तुच्छ कार्यात्मक निर्भरता
Trivial- यदि एक कार्यात्मक निर्भरता (एफडी) एक्स → वाई रखती है, जहां वाई एक्स का एक सबसेट है, तो इसे एक तुच्छ एफडी कहा जाता है। तुच्छ FDs हमेशा पकड़।
Non-trivial - यदि एक एफडी एक्स → वाई धारण करता है, जहां वाई एक्स का एक सबसेट नहीं है, तो इसे गैर-तुच्छ एफडी कहा जाता है।
Completely non-trivial - यदि एक एफडी एक्स → वाई धारण करता है, जहां एक्स एक्सरे वाई = an है, तो इसे पूरी तरह से गैर-तुच्छ एफडी कहा जाता है।
मानकीकरण
यदि डेटाबेस डिज़ाइन सही नहीं है, तो इसमें विसंगतियाँ हो सकती हैं, जो किसी भी डेटाबेस व्यवस्थापक के लिए एक बुरे सपने की तरह हैं। विसंगतियों के साथ एक डेटाबेस का प्रबंधन असंभव के बगल में है।
Update anomalies- यदि डेटा आइटम बिखरे हुए हैं और एक-दूसरे से ठीक से नहीं जुड़े हैं, तो यह अजीब स्थिति पैदा कर सकता है। उदाहरण के लिए, जब हम एक डेटा आइटम को अपडेट करने की कोशिश करते हैं, तो इसकी प्रतियां कई जगहों पर बिखरी होती हैं, कुछ उदाहरण ठीक से अपडेट हो जाते हैं जबकि कुछ अन्य पुराने मूल्यों के साथ छोड़ दिए जाते हैं। ऐसे उदाहरण डेटाबेस को असंगत स्थिति में छोड़ देते हैं।
Deletion anomalies - हमने एक रिकॉर्ड को हटाने की कोशिश की, लेकिन इसके कुछ हिस्सों को अनजाने में छोड़ दिया गया था, डेटा को कहीं और भी सहेजा गया है।
Insert anomalies - हमने एक रिकॉर्ड में डेटा डालने की कोशिश की जो बिल्कुल भी मौजूद नहीं है।
सामान्यीकरण इन सभी विसंगतियों को दूर करने और डेटाबेस को एक सुसंगत स्थिति में लाने की एक विधि है।
पहला सामान्य रूप
पहले नॉर्मल फॉर्म को संबंधों (टेबल) की परिभाषा में ही परिभाषित किया गया है। यह नियम परिभाषित करता है कि एक संबंध में सभी विशेषताओं में परमाणु डोमेन होना चाहिए। एक परमाणु डोमेन में मूल्य अविभाज्य इकाइयाँ हैं।
हम पहले के रूप में संबंध (तालिका) को फिर से व्यवस्थित करते हैं, इसे फर्स्ट नॉर्मल फॉर्म में बदलने के लिए।
प्रत्येक विशेषता में उसके पूर्व-निर्धारित डोमेन से केवल एक ही मान होना चाहिए।
दूसरा सामान्य रूप
इससे पहले कि हम दूसरे सामान्य रूप के बारे में जानें, हमें निम्नलिखित बातों को समझना होगा -
Prime attribute - एक विशेषता, जो उम्मीदवार-कुंजी का एक हिस्सा है, एक प्रमुख विशेषता के रूप में जानी जाती है।
Non-prime attribute - एक विशेषता, जो प्रधान-कुंजी का हिस्सा नहीं है, को एक गैर-प्रमुख विशेषता कहा जाता है।
यदि हम दूसरे सामान्य रूप का अनुसरण करते हैं, तो प्रत्येक गैर-प्राइम विशेषता को पूरी तरह कार्यात्मक रूप से प्रमुख कुंजी विशेषता पर निर्भर होना चाहिए। यही है, यदि X → A धारण करता है, तो X का कोई उचित उपसमूह नहीं होना चाहिए, जिसके लिए Y → A भी सही है।
हम यहां विद्यार्थी_प्रोजेक्ट के संबंध में देखते हैं कि मुख्य प्रमुख विशेषताएँ Stu_ID और Proj_ID हैं। नियम के अनुसार, गैर-प्रमुख विशेषताओं, अर्थात Stu_Name और Proj_Name को दोनों पर निर्भर होना चाहिए और किसी भी प्रमुख प्रमुख विशेषता पर व्यक्तिगत रूप से नहीं। लेकिन हम पाते हैं कि Stu_Name की पहचान Stu_ID द्वारा की जा सकती है और Proj_Name की पहचान Proj_ID द्वारा स्वतंत्र रूप से की जा सकती है। यह कहा जाता हैpartial dependency, जिसे सेकंड नॉर्मल फॉर्म में अनुमति नहीं है।
हमने उपरोक्त चित्र में दर्शाए अनुसार दो में संबंध तोड़ दिया। इसलिए कोई आंशिक निर्भरता नहीं है।
तीसरा सामान्य रूप
थर्ड नॉर्मल फॉर्म में होने वाले रिलेशन के लिए, इसे सेकंड नॉर्मल फॉर्म में होना चाहिए और निम्नलिखित को पूरा करना होगा -
- कोई भी गैर-प्राइम विशेषता मुख्य कुंजी विशेषता पर ट्रांसेटिव रूप से निर्भर नहीं है।
- किसी भी गैर-तुच्छ कार्यात्मक निर्भरता के लिए, एक्स → ए, फिर या तो -
-
X एक सुपरकी है या
- A प्रमुख विशेषता है।
हम पाते हैं कि उपरोक्त Student_detail संबंध में, Stu_ID कुंजी और केवल प्रमुख कुंजी विशेषता है। हम पाते हैं कि सिटी की पहचान Stu_ID के साथ-साथ ज़िप से ही की जा सकती है। न तो ज़िप एक सुपरकी है और न ही सिटी एक प्रमुख विशेषता है। इसके अतिरिक्त, Stu_ID → ज़िप → शहर, इसलिए वहां मौजूद हैtransitive dependency।
इस संबंध को तीसरे सामान्य रूप में लाने के लिए, हम संबंध को दो संबंधों में तोड़ते हैं -
बॉयस-कोड्ड सामान्य रूप
बॉयस-कोड्ड नॉर्मल फॉर्म (बीसीएनएफ) सख्त शर्तों पर थर्ड नॉर्मल फॉर्म का विस्तार है। BCNF में कहा गया है कि -
- किसी भी गैर-तुच्छ कार्यात्मक निर्भरता के लिए, X → A, X एक सुपर-कुंजी होना चाहिए।
उपरोक्त छवि में, Stu_ID संबंध में सुपर-की है Student_Detail और ज़िप, ZipCodes के संबंध में सुपर-कुंजी है। इसलिए,
Stu_ID → Stu_Name, ज़िप
तथा
ज़िप → शहर
जो इस बात की पुष्टि करता है कि दोनों संबंध बीसीएनएफ में हैं।
हम दो संबंधों के कार्टेशियन उत्पाद को लेने के लाभों को समझते हैं, जो हमें एक साथ जोड़े जाने वाले सभी संभावित ट्यूपल्स प्रदान करता है। लेकिन कुछ मामलों में कार्टेसियन उत्पाद लेने के लिए यह हमारे लिए संभव नहीं हो सकता है, जहां हम हजारों बड़ी संख्या में विशेषता के साथ बड़े संबंधों का सामना करते हैं।
Joinएक कार्टेशियन उत्पाद का एक संयोजन है, जिसके बाद चयन प्रक्रिया होती है। एक ऑपरेशन में शामिल हों अलग-अलग संबंधों से दो ट्यूपल जोड़ते हैं, अगर और केवल अगर किसी दिए गए जॉइन की स्थिति संतुष्ट है।
हम निम्नलिखित अनुभागों में विभिन्न सम्मिलित प्रकारों का संक्षेप में वर्णन करेंगे।
थीटा (θ) सम्मिलित हों
थीटा जुड़ने से अलग-अलग संबंधों से जुड़ाव होता है, बशर्ते वे थीटा स्थिति को पूरा करते हैं। प्रतीक से जुड़ने की स्थिति को निरूपित किया जाता हैθ।
नोटेशन
R1 ⋈θ R2
R1 और R2 संबंध रखने वाले गुण हैं (A1, A2, .., An) और (B1, B2, .., Bn) जैसे कि विशेषताओं में कुछ भी सामान्य नहीं है, वह है R1 = R2 = Φ।
थीटा जॉइन सभी प्रकार के तुलना ऑपरेटरों का उपयोग कर सकता है।
छात्र सिड नाम कक्षा 101 एलेक्स 10 102 मारिया 1 1 विषयों कक्षा विषय 10 गणित 10 अंग्रेज़ी 1 1 संगीत 1 1 खेल छात्र_देल =
STUDENT ⋈Student.Std = Subject.Class SUBJECT
Student_detail सिड नाम कक्षा कक्षा विषय 101 एलेक्स 10 10 गणित 101 एलेक्स 10 10 अंग्रेज़ी 102 मारिया 1 1 1 1 संगीत 102 मारिया 1 1 1 1 खेल Equijoin
जब थीटा ज्वाइन हो जाता है equalityतुलना ऑपरेटर, इसे समरूप कहा जाता है। उपरोक्त उदाहरण इक्विज़न से मेल खाता है।
प्राकृतिक जुड़ाव ( ⋈ )
प्राकृतिक जुड़ाव किसी भी तुलना ऑपरेटर का उपयोग नहीं करता है। यह कार्टेसियन उत्पाद जिस तरह से करता है, उसे समाप्त नहीं करता है। हम केवल एक प्राकृतिक जुड़ाव का प्रदर्शन कर सकते हैं यदि कम से कम एक सामान्य विशेषता है जो दो संबंधों के बीच मौजूद है। इसके अतिरिक्त, विशेषताओं में समान नाम और डोमेन होना चाहिए।
प्राकृतिक जुड़ाव उन मिलान विशेषताओं पर कार्य करता है जहां दोनों संबंधों में विशेषताओं के मूल्य समान हैं।
पाठ्यक्रम सीआईडी कोर्स विभाग CS01 डेटाबेस सीएस ME01 यांत्रिकी ME EE01 इलेक्ट्रानिक्स ईई विभागाध्यक्ष विभाग सिर सीएस एलेक्स ME माया ईई मीरा पाठ्यक्रम D HoD विभाग सीआईडी कोर्स सिर सीएस CS01 डेटाबेस एलेक्स ME ME01 यांत्रिकी माया ईई EE01 इलेक्ट्रानिक्स मीरा बाहरी जोड़
थीटा जॉइन, इक्विजोन और नेचुरल जॉइन को इनर जॉइन कहा जाता है। एक आंतरिक जुड़ाव में मिलान विशेषताओं के साथ केवल उन tuples शामिल हैं और बाकी को परिणामी रिश्ते में छोड़ दिया गया है। इसलिए, परिणामी संबंधों में भाग लेने वाले संबंधों से सभी tuples को शामिल करने के लिए हमें बाहरी जोड़ का उपयोग करने की आवश्यकता है। तीन प्रकार के बाहरी जुड़ाव हैं - बाएं बाहरी जुड़ाव, दायां बाहरी जुड़ाव और पूर्ण बाहरी जुड़ाव।
बायाँ बाहरी जोड़ (R
वाम संबंध से सभी tuples, आर, परिणामी रिश्ते में शामिल हैं। यदि राइट रिलेशन S में बिना किसी मैचिंग के Tuple के बिना R में ट्यूपल हैं, तो परिणामी रिलेशन के S- फीचर्स को फुल बना दिया जाता है।
बाएं ए ख 100 डेटाबेस 101 यांत्रिकी 102 इलेक्ट्रानिक्स सही ए ख 100 एलेक्स 102 माया 104 मीरा पाठ्यक्रम ए ख सी घ 100 डेटाबेस 100 एलेक्स 101 यांत्रिकी --- --- 102 इलेक्ट्रानिक्स 102 माया दायां बाहरी जोड़: (R
सही संबंध से सभी tuples, S, परिणामी संबंध में शामिल हैं। यदि R में किसी भी मिलान के tuple के बिना S में ट्यूपल्स हैं, तो परिणामी संबंध के R- विशेषताओं को NULL बनाया जाता है।
पाठ्यक्रम ए ख सी घ 100 डेटाबेस 100 एलेक्स 102 इलेक्ट्रानिक्स 102 माया --- --- 104 मीरा पूर्ण बाहरी शामिल हों: (आर
दोनों भाग लेने वाले संबंधों से सभी tuples परिणामी संबंध में शामिल हैं। यदि दोनों संबंधों के लिए कोई मिलान ट्यूपल नहीं हैं, तो उनकी संबंधित बेजोड़ विशेषताओं को NULL बनाया जाता है।
पाठ्यक्रम ए ख सी घ 100 डेटाबेस 100 एलेक्स 101 यांत्रिकी --- --- 102 इलेक्ट्रानिक्स 102 माया --- --- 104 मीरा डेटाबेस फ़ाइल स्वरूपों में संग्रहीत होते हैं, जिनमें रिकॉर्ड होते हैं। भौतिक स्तर पर, वास्तविक डेटा कुछ डिवाइस पर विद्युत चुम्बकीय प्रारूप में संग्रहीत किया जाता है। इन भंडारण उपकरणों को मोटे तौर पर तीन प्रकारों में वर्गीकृत किया जा सकता है -
Primary Storage- मेमोरी मेमोरी जो सीधे सीपीयू तक पहुंचती है, इस श्रेणी में आती है। सीपीयू की आंतरिक मेमोरी (रजिस्टर), फास्ट मेमोरी (कैश), और मुख्य मेमोरी (रैम) सीधे सीपीयू के लिए सुलभ हैं, क्योंकि वे सभी मदरबोर्ड या सीपीयू चिपसेट पर रखे गए हैं। यह स्टोरेज आमतौर पर बहुत छोटा, अल्ट्रा-फास्ट और वाष्पशील होता है। प्राथमिक भंडारण को अपने राज्य को बनाए रखने के लिए निरंतर बिजली की आपूर्ति की आवश्यकता होती है। बिजली की विफलता के मामले में, इसका सारा डेटा खो जाता है।
Secondary Storage- माध्यमिक भंडारण उपकरणों का उपयोग भविष्य में उपयोग के लिए या बैकअप के रूप में डेटा को स्टोर करने के लिए किया जाता है। द्वितीयक भंडारण में मेमोरी डिवाइस शामिल हैं जो सीपीयू चिपसेट या मदरबोर्ड का हिस्सा नहीं हैं, उदाहरण के लिए, चुंबकीय डिस्क, ऑप्टिकल डिस्क (डीवीडी, सीडी, आदि), हार्ड डिस्क, फ्लैश ड्राइव और चुंबकीय टेप।
Tertiary Storage- तृतीयक भंडारण का उपयोग डेटा के विशाल मात्रा को संग्रहीत करने के लिए किया जाता है। चूंकि इस तरह के भंडारण उपकरण कंप्यूटर सिस्टम के लिए बाहरी हैं, इसलिए वे गति में सबसे धीमे हैं। इन भंडारण उपकरणों का उपयोग ज्यादातर संपूर्ण सिस्टम के बैक अप लेने के लिए किया जाता है। तृतीयक भंडारण के रूप में ऑप्टिकल डिस्क और चुंबकीय टेप का व्यापक रूप से उपयोग किया जाता है।
स्मृति पदानुक्रम
एक कंप्यूटर प्रणाली में स्मृति की एक अच्छी तरह से परिभाषित पदानुक्रम है। एक सीपीयू के पास मुख्य मेमोरी के साथ-साथ इसके इनबिल्ट रजिस्टरों तक सीधी पहुंच है। मुख्य मेमोरी का एक्सेस समय स्पष्ट रूप से सीपीयू की गति से कम है। इस स्पीड बेमेल को कम करने के लिए, कैश मेमोरी शुरू की जाती है। कैश मेमोरी सबसे तेज़ एक्सेस टाइम प्रदान करती है और इसमें वह डेटा होता है जो सीपीयू द्वारा सबसे अधिक बार एक्सेस किया जाता है।
सबसे तेज पहुंच वाली मेमोरी सबसे महंगी है। बड़े भंडारण उपकरण धीमी गति की पेशकश करते हैं और वे कम महंगे हैं, हालांकि वे सीपीयू रजिस्टरों या कैश मेमोरी की तुलना में डेटा की बड़ी मात्रा में स्टोर कर सकते हैं।
चुंबकीय डिस्क
वर्तमान कंप्यूटर सिस्टम में हार्ड डिस्क ड्राइव सबसे आम सेकेंडरी स्टोरेज डिवाइस हैं। इन्हें चुंबकीय डिस्क कहा जाता है क्योंकि वे सूचना को संग्रहीत करने के लिए चुंबकीयकरण की अवधारणा का उपयोग करते हैं। हार्ड डिस्क में मैग्नेटाइसेबल मटीरियल के साथ कोटेड मेटल डिस्क होते हैं। इन डिस्क को एक धुरी पर लंबवत रखा जाता है। डिस्क के बीच में एक रीड / राइट हेड चलता है और इसके नीचे स्पॉट को मैग्नेटाइज या डी-मैग्नेटाइज करने के लिए उपयोग किया जाता है। एक चुम्बकीय स्थान को 0 (शून्य) या 1 (एक) के रूप में पहचाना जा सकता है।
हार्ड डिस्क को कुशलता से डेटा स्टोर करने के लिए एक अच्छी तरह से परिभाषित क्रम में स्वरूपित किया जाता है। एक हार्ड डिस्क प्लेट पर कई संकेंद्रित वृत्त होते हैं, जिन्हें कहा जाता हैtracks। हर ट्रैक को आगे विभाजित किया गया हैsectors। हार्ड डिस्क पर एक सेक्टर आमतौर पर 512 बाइट्स डेटा संग्रहीत करता है।
छापा
RAID के लिए खड़ा है Redundant Aकी गड़बड़ी Independent Disks, जो कि कई द्वितीयक संग्रहण उपकरणों को जोड़ने और उन्हें एकल संग्रहण मीडिया के रूप में उपयोग करने की एक तकनीक है।
RAID में डिस्क की एक सरणी होती है जिसमें विभिन्न लक्ष्यों को प्राप्त करने के लिए कई डिस्क एक साथ जुड़े होते हैं। RAID स्तर डिस्क सरणियों के उपयोग को परिभाषित करता है।
RAID 0- इस स्तर में, डिस्क का एक धारीदार सरणी लागू किया जाता है। डेटा ब्लॉक में टूट गया है और ब्लॉक डिस्क के बीच वितरित किए गए हैं। प्रत्येक डिस्क को समानांतर में लिखने / पढ़ने के लिए डेटा का एक ब्लॉक प्राप्त होता है। यह स्टोरेज डिवाइस की गति और प्रदर्शन को बढ़ाता है। लेवल 0 में कोई समानता और बैकअप नहीं है।
RAID 1- RAID 1 मिररिंग तकनीकों का उपयोग करता है। जब डेटा को एक RAID नियंत्रक के लिए भेजा जाता है, तो यह सरणी में सभी डिस्क पर डेटा की एक प्रति भेजता है। RAID स्तर 1 भी कहा जाता हैmirroring और एक विफलता के मामले में 100% अतिरेक प्रदान करता है।
RAID 2- RAID 2 विभिन्न डेटा पर धारीदार, अपने डेटा के लिए दूरी का उपयोग करते हुए त्रुटि सुधार कोड रिकॉर्ड करता है। स्तर 0 की तरह, एक शब्द में प्रत्येक डेटा बिट एक अलग डिस्क पर दर्ज किया जाता है और डेटा शब्दों के ईसीसी कोड एक अलग सेट डिस्क पर संग्रहीत होते हैं। इसकी जटिल संरचना और उच्च लागत के कारण, RAID 2 व्यावसायिक रूप से उपलब्ध नहीं है।
RAID 3- RAID 3 कई डिस्क पर डेटा स्ट्रिप करता है। डेटा शब्द के लिए उत्पन्न समता बिट एक अलग डिस्क पर संग्रहीत है। यह तकनीक एकल डिस्क विफलताओं को दूर करने के लिए इसे बनाती है।
RAID 4- इस स्तर में, डेटा डिस्क पर डेटा का एक पूरा ब्लॉक लिखा जाता है और फिर समता उत्पन्न होती है और एक अलग डिस्क पर संग्रहीत होती है। ध्यान दें कि स्तर 3 बाइट-स्तरीय स्ट्रिपिंग का उपयोग करता है, जबकि स्तर 4 ब्लॉक-स्तर स्ट्रिपिंग का उपयोग करता है। दोनों स्तर 3 और स्तर 4 को RAID को लागू करने के लिए कम से कम तीन डिस्क की आवश्यकता होती है।
RAID 5 - RAID 5 पूरे डेटा ब्लॉक को अलग-अलग डिस्क पर लिखता है, लेकिन डेटा ब्लॉक स्ट्राइप के लिए उत्पन्न समानता बिट्स को सभी डेटा डिस्क के बीच एक अलग समर्पित डिस्क पर संग्रहीत करने के बजाय वितरित किया जाता है।
RAID 6- RAID 6 स्तर का एक विस्तार है 5. इस स्तर में, दो स्वतंत्र समानताएं उत्पन्न होती हैं और कई डिस्क के बीच वितरित फैशन में संग्रहीत की जाती हैं। दो समानताएं अतिरिक्त दोष सहिष्णुता प्रदान करती हैं। इस स्तर को RAID को लागू करने के लिए कम से कम चार डिस्क ड्राइव की आवश्यकता होती है।
सापेक्ष डेटा और जानकारी को फ़ाइल स्वरूपों में सामूहिक रूप से संग्रहीत किया जाता है। एक फ़ाइल बाइनरी प्रारूप में संग्रहीत रिकॉर्ड का एक क्रम है। एक डिस्क ड्राइव को कई ब्लॉकों में स्वरूपित किया जाता है जो रिकॉर्ड स्टोर कर सकते हैं। फ़ाइल रिकॉर्ड उन डिस्क ब्लॉक पर मैप किए जाते हैं।
फ़ाइल संगठन
फ़ाइल संगठन परिभाषित करता है कि डिस्क ब्लॉक पर फ़ाइल रिकॉर्ड कैसे मैप किए जाते हैं। फ़ाइल रिकॉर्ड को व्यवस्थित करने के लिए हमारे पास चार प्रकार के फ़ाइल संगठन हैं -
हीप फ़ाइल संगठन
जब कोई फ़ाइल हीप फ़ाइल संगठन का उपयोग करके बनाई जाती है, तो ऑपरेटिंग सिस्टम उस फ़ाइल को मेमोरी क्षेत्र को बिना किसी अन्य लेखांकन विवरण के आवंटित करता है। फ़ाइल रिकॉर्ड को उस मेमोरी क्षेत्र में कहीं भी रखा जा सकता है। रिकॉर्ड को प्रबंधित करना सॉफ्टवेयर की जिम्मेदारी है। हीप फाइल अपने आप में किसी भी क्रम, अनुक्रमण या अनुक्रमण का समर्थन नहीं करता है।
अनुक्रमिक फ़ाइल संगठन
प्रत्येक फ़ाइल रिकॉर्ड में विशिष्ट रूप से उस रिकॉर्ड को पहचानने के लिए एक डेटा फ़ील्ड (विशेषता) होती है। अनुक्रमिक फ़ाइल संगठन में, रिकॉर्ड्स को अद्वितीय कुंजी फ़ील्ड या खोज कुंजी के आधार पर कुछ अनुक्रमिक क्रम में फ़ाइल में रखा जाता है। व्यावहारिक रूप से, भौतिक रूप में सभी रिकॉर्डों को क्रमिक रूप से संग्रहीत करना संभव नहीं है।
हैश फ़ाइल संगठन
हैश फ़ाइल संगठन रिकॉर्ड्स के कुछ क्षेत्रों पर हैश फ़ंक्शन संगणना का उपयोग करता है। हैश फ़ंक्शन का आउटपुट डिस्क ब्लॉक के स्थान को निर्धारित करता है जहां रिकॉर्ड रखा जाना है।
क्लस्टर फ़ाइल संगठन
बड़े डेटाबेस के लिए संकुल फ़ाइल संगठन अच्छा नहीं माना जाता है। इस तंत्र में, एक या एक से अधिक संबंधों से संबंधित रिकॉर्ड एक ही डिस्क ब्लॉक में रखे जाते हैं, अर्थात रिकॉर्ड का क्रम प्राथमिक कुंजी या खोज कुंजी पर आधारित नहीं है।
फ़ाइल संचालन
डेटाबेस फ़ाइलों पर संचालन को मोटे तौर पर दो श्रेणियों में वर्गीकृत किया जा सकता है -
Update Operations
Retrieval Operations
अद्यतन संचालन सम्मिलन, विलोपन या अद्यतन द्वारा डेटा मानों को बदलते हैं। दूसरी ओर, पुनर्प्राप्ति ऑपरेशन, डेटा को परिवर्तित नहीं करते हैं, लेकिन वैकल्पिक सशर्त फ़िल्टरिंग के बाद उन्हें पुनर्प्राप्त करते हैं। दोनों प्रकार के कार्यों में, चयन एक महत्वपूर्ण भूमिका निभाता है। किसी फ़ाइल को बनाने और हटाने के अलावा, कई ऑपरेशन हो सकते हैं, जो फ़ाइलों पर किए जा सकते हैं।
Open - एक फाइल को दो मोड में से एक में खोला जा सकता है, read mode या write mode। रीड मोड में, ऑपरेटिंग सिस्टम किसी को डेटा को बदलने की अनुमति नहीं देता है। दूसरे शब्दों में, डेटा केवल पढ़ा जाता है। रीड मोड में खोली गई फ़ाइलों को कई संस्थाओं के बीच साझा किया जा सकता है। लिखें मोड डेटा संशोधन की अनुमति देता है। राइट मोड में खोली गई फ़ाइलों को पढ़ा जा सकता है लेकिन उन्हें साझा नहीं किया जा सकता है।
Locate- हर फाइल में एक फाइल पॉइंटर होता है, जो वर्तमान स्थिति बताता है कि डेटा कहां पढ़ा या लिखा जाना है। इस सूचक को तदनुसार समायोजित किया जा सकता है। खोज (तलाश) ऑपरेशन का उपयोग करके, इसे आगे या पीछे ले जाया जा सकता है।
Read- डिफ़ॉल्ट रूप से, जब फ़ाइलें रीड मोड में खोली जाती हैं, तो फ़ाइल पॉइंटर फ़ाइल की शुरुआत की ओर इशारा करता है। ऐसे विकल्प हैं जहां उपयोगकर्ता ऑपरेटिंग सिस्टम को बता सकता है कि फ़ाइल खोलने के समय फ़ाइल पॉइंटर का पता कैसे लगाया जाए। फ़ाइल पॉइंटर का अगला डेटा पढ़ा जाता है।
Write- उपयोगकर्ता लिखित मोड में एक फ़ाइल खोलने का चयन कर सकता है, जो उन्हें इसकी सामग्री को संपादित करने में सक्षम बनाता है। यह विलोपन, सम्मिलन या संशोधन हो सकता है। फ़ाइल पॉइंटर खोलने के समय स्थित हो सकता है या यदि ऑपरेटिंग सिस्टम ऐसा करने की अनुमति देता है तो इसे गतिशील रूप से बदला जा सकता है।
Close- यह ऑपरेटिंग सिस्टम के दृष्टिकोण से सबसे महत्वपूर्ण ऑपरेशन है। जब किसी फ़ाइल को बंद करने का अनुरोध उत्पन्न होता है, तो ऑपरेटिंग सिस्टम
- सभी ताले निकालता है (यदि साझा मोड में),
- सेकेंडरी स्टोरेज मीडिया को डेटा (यदि बदल दिया गया) और बचाता है
- फ़ाइल से जुड़े सभी बफ़र्स और फ़ाइल हैंडलर रिलीज़ करता है।
किसी फ़ाइल के अंदर डेटा का संगठन यहाँ एक प्रमुख भूमिका निभाता है। फ़ाइल पॉइंटर को फ़ाइल के अंदर वांछित रिकॉर्ड के लिए खोजने की प्रक्रिया, विभिन्न रिकॉर्ड के आधार पर क्रमिक रूप से या क्लस्टर किए गए हैं।
हम जानते हैं कि डेटा को रिकॉर्ड के रूप में संग्रहीत किया जाता है। हर रिकॉर्ड में एक महत्वपूर्ण क्षेत्र होता है, जो इसे विशिष्ट रूप से पहचानने में मदद करता है।
इंडेक्सिंग एक डेटा संरचना तकनीक है जो कुछ विशेषताओं के आधार पर डेटाबेस फ़ाइलों से रिकॉर्ड को कुशलतापूर्वक प्राप्त करने के लिए है, जिस पर इंडेक्सिंग की गई है। डेटाबेस सिस्टम में अनुक्रमण वह है जो हम पुस्तकों में देखते हैं।
अनुक्रमण को इसकी अनुक्रमण विशेषताओं के आधार पर परिभाषित किया गया है। अनुक्रमण निम्न प्रकार के हो सकते हैं -
Primary Index- प्राथमिक सूचकांक एक आदेशित डेटा फ़ाइल पर परिभाषित किया गया है। डेटा फ़ाइल एक पर आदेश दिया हैkey field। मुख्य क्षेत्र आमतौर पर संबंध की प्राथमिक कुंजी है।
Secondary Index - द्वितीयक सूचकांक एक क्षेत्र से उत्पन्न किया जा सकता है जो एक उम्मीदवार कुंजी है और प्रत्येक रिकॉर्ड में एक अद्वितीय मूल्य है, या डुप्लिकेट मानों के साथ एक गैर-कुंजी है।
Clustering Index- क्लस्टरिंग इंडेक्स एक ऑर्डर किए गए डेटा फ़ाइल पर परिभाषित किया गया है। डेटा फ़ाइल एक गैर-कुंजी फ़ील्ड पर ऑर्डर की जाती है।
क्रमबद्ध अनुक्रमण दो प्रकार का होता है -
- घना सूचकांक
- विरल सूचकांक
घना सूचकांक
घने सूचकांक में, डेटाबेस में प्रत्येक खोज कुंजी मान के लिए एक सूचकांक रिकॉर्ड होता है। यह तेजी से खोज करता है, लेकिन इंडेक्स रिकॉर्ड्स को स्टोर करने के लिए अधिक स्थान की आवश्यकता होती है। इंडेक्स रिकॉर्ड में डिस्क पर वास्तविक रिकॉर्ड के लिए खोज कुंजी मान और एक सूचक होता है।
विरल सूचकांक
विरल सूचकांक में, प्रत्येक खोज कुंजी के लिए सूचकांक रिकॉर्ड नहीं बनाए जाते हैं। यहां एक इंडेक्स रिकॉर्ड में डिस्क पर डेटा के लिए एक खोज कुंजी और एक वास्तविक सूचक होता है। किसी रिकॉर्ड को खोजने के लिए, हम सबसे पहले इंडेक्स रिकॉर्ड के आधार पर आगे बढ़ते हैं और डेटा के वास्तविक स्थान पर पहुंचते हैं। यदि हम जिस डेटा की तलाश कर रहे हैं वह वह नहीं है जहां हम सीधे सूचकांक का अनुसरण करके पहुंचते हैं, तो सिस्टम अनुक्रमिक खोज शुरू करता है जब तक कि वांछित डेटा नहीं मिलता है।
बहुस्तरीय सूचकांक
इंडेक्स रिकॉर्ड में खोज-कुंजी मान और डेटा पॉइंटर्स शामिल हैं। मल्टीलेवल इंडेक्स डिस्क पर वास्तविक डेटाबेस फ़ाइलों के साथ संग्रहीत किया जाता है। जैसे-जैसे डेटाबेस का आकार बढ़ता है, वैसे-वैसे सूचकांकों का आकार बढ़ता जाता है। सूचकांक रिकॉर्ड को मुख्य मेमोरी में रखने की आवश्यकता है ताकि खोज कार्यों को तेज किया जा सके। यदि सिंगल-लेवल इंडेक्स का उपयोग किया जाता है, तो बड़े आकार के इंडेक्स को मेमोरी में नहीं रखा जा सकता है जो कई डिस्क एक्सेस तक ले जाता है।
मल्टी लेवल इंडेक्स सबसे छोटे स्तर को बनाने के लिए इंडेक्स को कई छोटे सूचकांकों में तोड़ने में मदद करता है ताकि इसे एक सिंगल डिस्क ब्लॉक में बचाया जा सके, जिसे आसानी से मुख्य मेमोरी में कहीं भी समायोजित किया जा सकता है।
ब + वृक्ष
AB + ट्री एक संतुलित बाइनरी सर्च ट्री है जो मल्टी-लेवल इंडेक्स फॉर्मेट का अनुसरण करता है। B + ट्री का लीफ नोड वास्तविक डेटा पॉइंटर्स दर्शाता है। बी + पेड़ सुनिश्चित करता है कि सभी पत्ती नोड्स एक ही ऊंचाई पर रहें, इस प्रकार संतुलित। इसके अतिरिक्त, पत्ती नोड्स एक लिंक सूची का उपयोग करके जुड़े हुए हैं; इसलिए, एक B + वृक्ष यादृच्छिक पहुँच के साथ-साथ अनुक्रमिक पहुँच का समर्थन कर सकता है।
बी + ट्री की संरचना
प्रत्येक पत्ती नोड मूल नोड से समान दूरी पर है। एबी + वृक्ष क्रम का हैn कहाँ पे nहर बी + पेड़ के लिए तय है ।
Internal nodes -
- रूट नोड को छोड़कर आंतरिक (गैर-पत्ती) नोड्स में कम से कम ⌉n / 2ers पॉइंटर्स होते हैं।
- अधिक से अधिक, एक आंतरिक नोड में हो सकता है n संकेत दिए गए।
Leaf nodes -
- लीफ नोड्स में कम से कम /n / 2odes रिकॉर्ड पॉइंटर्स और ⌉n / 2 values प्रमुख मान होते हैं।
- अधिकतम पर, एक पत्ती नोड शामिल हो सकता है n रिकॉर्ड संकेत और n प्रमुख मूल्य।
- हर लीफ नोड में एक ब्लॉक पॉइंटर होता है P अगले पत्ते नोड को इंगित करने के लिए और एक लिंक की गई सूची बनाता है।
बी + ट्री सम्मिलन
बी + पेड़ नीचे से भरे जाते हैं और प्रत्येक प्रवेश पत्ती के नोड पर किया जाता है।
- यदि एक पत्ती नोड अधिकता है -
नोड को दो भागों में विभाजित करें।
पर विभाजन i = ⌊(m+1)/2⌋.
प्रथम i प्रविष्टियों को एक नोड में संग्रहीत किया जाता है।
बाकी प्रविष्टियाँ (i + 1 बाद में) एक नए नोड में स्थानांतरित की जाती हैं।
ith कुंजी को पत्ता के माता-पिता पर दोहराया गया है।
यदि एक गैर-पत्ती नोड अधिकता है -
नोड को दो भागों में विभाजित करें।
नोड पर विभाजन i = ⌈(m+1)/2⌉।
तक प्रविष्ट करता है i एक नोड में रखे गए हैं।
बाकी प्रविष्टियों को एक नए नोड में स्थानांतरित कर दिया गया है।
बी + ट्री विलोपन
पत्ती नोड्स पर बी + ट्री प्रविष्टियां हटा दी जाती हैं।
लक्ष्य प्रविष्टि को खोजा और हटा दिया गया है।
यदि यह एक आंतरिक नोड है, तो बाईं स्थिति से प्रविष्टि के साथ हटाएं और बदलें।
हटाने के बाद, अंडरफ्लो का परीक्षण किया जाता है,
यदि अंडरफ़्लो होता है, तो उसके द्वारा छोड़े गए नोड्स से प्रविष्टियों को वितरित करें।
यदि वितरण बाएं से संभव नहीं है, तो
इसके लिए नोड्स से वितरित करें।
यदि वितरण बाएं या दाएं से संभव नहीं है, तो
नोड को बाएँ और दाएँ के साथ मर्ज करें।
एक विशाल डेटाबेस संरचना के लिए, अपने सभी स्तर के माध्यम से सभी सूचकांक मूल्यों को खोजना लगभग असंभव हो सकता है और फिर वांछित डेटा प्राप्त करने के लिए गंतव्य डेटा ब्लॉक तक पहुंच सकता है। इंडेक्स संरचना का उपयोग किए बिना डिस्क पर डेटा रिकॉर्ड के प्रत्यक्ष स्थान की गणना करने के लिए हैशिंग एक प्रभावी तकनीक है।
किसी डेटा रिकॉर्ड का पता उत्पन्न करने के लिए हैशिंग खोज कुंजी के साथ हैश फ़ंक्शंस का उपयोग करता है।
हश संगठन
Bucket- एक हैश फ़ाइल बाल्टी प्रारूप में डेटा संग्रहीत करता है। बाल्टी को भंडारण की इकाई माना जाता है। एक बाल्टी आमतौर पर एक पूर्ण डिस्क ब्लॉक को स्टोर करती है, जो बदले में एक या अधिक रिकॉर्ड स्टोर कर सकती है।
Hash Function - एक हैश फ़ंक्शन, h, एक मैपिंग फ़ंक्शन है जो खोज-कुंजी के सभी सेट को मैप करता है Kउस पते पर जहां वास्तविक रिकॉर्ड रखे गए हैं। यह खोज कुंजियों से बाल्टी के पते तक का एक कार्य है।
स्टेटिक हैशिंग
स्थिर हैशिंग में, जब खोज-कुंजी मान प्रदान किया जाता है, हैश फ़ंक्शन हमेशा समान पते की गणना करता है। उदाहरण के लिए, यदि mod-4 हैश फ़ंक्शन का उपयोग किया जाता है, तो यह केवल 5 मान उत्पन्न करेगा। आउटपुट पता हमेशा उस फ़ंक्शन के लिए समान होगा। प्रदान की गई बाल्टियों की संख्या हर समय अपरिवर्तित रहती है।
ऑपरेशन
Insertion - जब स्थिर हैश, हैश फ़ंक्शन का उपयोग करके एक रिकॉर्ड दर्ज किया जाना आवश्यक है h खोज कुंजी के लिए बकेट पते की गणना करता है K, जहां रिकॉर्ड संग्रहीत किया जाएगा।
बाल्टी का पता = h (K)
Search - जब एक रिकॉर्ड को पुनः प्राप्त करने की आवश्यकता होती है, तो उसी हैश फ़ंक्शन का उपयोग बाल्टी के पते को पुनः प्राप्त करने के लिए किया जा सकता है जहां डेटा संग्रहीत किया जाता है।
Delete - यह केवल एक खोज है जिसके बाद डिलीट ऑपरेशन होता है।
बकेट ओवरफ्लो
बाल्टी-ओवरफ्लो की स्थिति के रूप में जाना जाता है collision। यह किसी भी स्थिर हैश फ़ंक्शन के लिए एक घातक स्थिति है। इस मामले में, अतिप्रवाह चेनिंग का उपयोग किया जा सकता है।
Overflow Chaining- जब बाल्टी भरी जाती है, उसी हैश परिणाम के लिए एक नई बाल्टी आवंटित की जाती है और पिछले एक के बाद लिंक की जाती है। इस तंत्र को कहा जाता हैClosed Hashing।
Linear Probing- जब कोई हैश फ़ंक्शन एक पता बनाता है जिस पर डेटा पहले से ही संग्रहीत है, तो अगले मुफ्त बाल्टी को आवंटित किया जाता है। इस तंत्र को कहा जाता हैOpen Hashing।
डायनेमिक हाशिंग
स्थिर हैशिंग के साथ समस्या यह है कि यह गतिशील रूप से विस्तार या सिकुड़ता नहीं है क्योंकि डेटाबेस का आकार बढ़ता या सिकुड़ता है। डायनेमिक हैशिंग एक तंत्र प्रदान करता है जिसमें डेटा बकेट को गतिशील और ऑन-डिमांड में जोड़ा जाता है और हटा दिया जाता है। डायनेमिक हैशिंग के रूप में भी जाना जाता हैextended hashing।
हैश फ़ंक्शन, गतिशील हैशिंग में, मूल्यों की एक बड़ी संख्या का उत्पादन करने के लिए बनाया गया है और केवल कुछ ही शुरू में उपयोग किए जाते हैं।
संगठन
पूरे हैश मान के उपसर्ग को हैश इंडेक्स के रूप में लिया जाता है। बाल्टी के पतों की गणना के लिए हैश मान के केवल एक हिस्से का उपयोग किया जाता है। हैश फ़ंक्शन की गणना के लिए कितने बिट्स का उपयोग किया जाता है, यह दर्शाने के लिए हर हैश इंडेक्स का गहन मान होता है। ये बिट्स 2n बाल्टियों को संबोधित कर सकते हैं। जब इन सभी बिट्स का उपभोग किया जाता है - अर्थात, जब सभी बाल्टी भरी होती हैं - तब गहराई मूल्य को रैखिक रूप से बढ़ाया जाता है और दो बार बाल्टी आवंटित की जाती है।
ऑपरेशन
Querying - हैश इंडेक्स की गहराई मूल्य को देखें और उन बिट्स का उपयोग बकेट एड्रेस की गणना के लिए करें।
Update - ऊपर एक क्वेरी करें और डेटा को अपडेट करें।
Deletion - वांछित डेटा का पता लगाने और उसी को हटाने के लिए एक क्वेरी करें।
Insertion - बाल्टी के पते की गणना करें
- अगर बाल्टी पहले से ही भरी है।
- अधिक बाल्टी जोड़ें।
- हैश मान में अतिरिक्त बिट्स जोड़ें।
- हैश फ़ंक्शन की पुन: गणना करें।
- अन्य
- बाल्टी में डेटा जोड़ें,
- यदि सभी बाल्टियाँ भरी हैं, तो स्थिर हैशिंग के उपचार करें।
- अगर बाल्टी पहले से ही भरी है।
जब कुछ क्रम में डेटा व्यवस्थित किया जाता है और प्रश्नों को डेटा की एक श्रृंखला की आवश्यकता होती है तो हैशिंग अनुकूल नहीं होती है। जब डेटा असतत और यादृच्छिक होता है, हैश सबसे अच्छा प्रदर्शन करता है।
हैशिंग एल्गोरिदम में अनुक्रमण की तुलना में उच्च जटिलता है। सभी हैश ऑपरेशन निरंतर समय में किए जाते हैं।
लेनदेन को कार्यों के समूह के रूप में परिभाषित किया जा सकता है। एक एकल कार्य न्यूनतम प्रसंस्करण इकाई है जिसे आगे विभाजित नहीं किया जा सकता है।
आइए एक सरल लेन-देन का उदाहरण लेते हैं। मान लीजिए कि एक बैंक कर्मचारी A के खाते से B के खाते में 500 रुपये स्थानांतरित करता है। इस बहुत ही सरल और छोटे लेनदेन में कई निम्न-स्तरीय कार्य शामिल हैं।
A’s Account
Open_Account(A) Old_Balance = A.balance New_Balance = Old_Balance - 500 A.balance = New_Balance Close_Account(A)
B’s Account
Open_Account(B) Old_Balance = B.balance New_Balance = Old_Balance + 500 B.balance = New_Balance Close_Account(B)
ACID गुण
लेन-देन एक कार्यक्रम की एक बहुत छोटी इकाई है और इसमें कई लोवेल कार्य हो सकते हैं। एक डेटाबेस सिस्टम में एक लेनदेन बनाए रखना चाहिएAtomicity, Consistency, Iविलाप, और Dउपयोगिता - जिसे सटीकता, पूर्णता और डेटा अखंडता सुनिश्चित करने के लिए आमतौर पर एसीआईडी गुणों के रूप में जाना जाता है।
Atomicity- इस संपत्ति में कहा गया है कि एक लेनदेन को एक परमाणु इकाई के रूप में माना जाना चाहिए, अर्थात, या तो इसके सभी कार्यों को निष्पादित किया जाता है या कोई भी नहीं। एक डेटाबेस में कोई राज्य नहीं होना चाहिए जहां एक लेनदेन आंशिक रूप से पूरा हो गया है। लेन-देन के निष्पादन से पहले या लेनदेन के निष्पादन / गर्भपात / विफलता के बाद राज्यों को परिभाषित किया जाना चाहिए।
Consistency- किसी भी लेन-देन के बाद डेटाबेस एक सुसंगत स्थिति में रहना चाहिए। डेटाबेस में रहने वाले डेटा पर किसी भी लेनदेन का कोई प्रतिकूल प्रभाव नहीं होना चाहिए। यदि लेनदेन के निष्पादन से पहले डेटाबेस एक सुसंगत स्थिति में था, तो लेनदेन के निष्पादन के बाद भी यह लगातार बना रहना चाहिए।
Durability- डेटाबेस इतना टिकाऊ होना चाहिए कि सिस्टम के विफल होने या फिर से चालू होने पर भी उसके सभी नवीनतम अपडेट को दबाए रखा जा सके। यदि कोई लेनदेन किसी डेटाबेस में डेटा का एक हिस्सा अपडेट करता है और करता है, तो डेटाबेस संशोधित डेटा को रखेगा। यदि कोई लेन-देन शुरू हो जाता है, लेकिन डेटा डिस्क पर लिखे जाने से पहले सिस्टम विफल हो जाता है, तो सिस्टम में कार्रवाई के बाद एक बार डेटा को अपडेट किया जाएगा।
Isolation- एक डेटाबेस प्रणाली में जहां एक से अधिक लेनदेन एक साथ और समानांतर रूप से निष्पादित किए जा रहे हैं, अलगाव की संपत्ति में कहा गया है कि सभी लेनदेन किए जाएंगे और निष्पादित किए जाएंगे जैसे कि यह सिस्टम में एकमात्र लेनदेन है। कोई भी लेनदेन किसी अन्य लेनदेन के अस्तित्व को प्रभावित नहीं करेगा।
serializability
जब मल्टीप्रोग्रामिंग वातावरण में ऑपरेटिंग सिस्टम द्वारा कई लेनदेन निष्पादित किए जा रहे हैं, तो संभावनाएं हैं कि एक लेनदेन के निर्देश कुछ अन्य लेनदेन के साथ जुड़े हुए हैं।
Schedule- लेनदेन के कालानुक्रमिक निष्पादन अनुक्रम को अनुसूची कहा जाता है। एक अनुसूची में कई लेनदेन हो सकते हैं, प्रत्येक में कई निर्देश / कार्य शामिल होंगे।
Serial Schedule- यह एक अनुसूची है जिसमें लेनदेन को इस तरह से संरेखित किया जाता है कि एक लेनदेन को पहले निष्पादित किया जाता है। जब पहला लेन-देन अपना चक्र पूरा करता है, तो अगले लेनदेन को निष्पादित किया जाता है। लेन-देन का आदेश एक के बाद एक दिया जाता है। इस प्रकार के शेड्यूल को एक सीरियल शेड्यूल कहा जाता है, क्योंकि लेनदेन को सीरियल तरीके से निष्पादित किया जाता है।
एक बहु-लेनदेन वातावरण में, धारावाहिक कार्यक्रम को एक बेंचमार्क माना जाता है। लेन-देन में एक निर्देश के निष्पादन अनुक्रम को बदला नहीं जा सकता है, लेकिन दो लेनदेन उनके निर्देशों को यादृच्छिक तरीके से निष्पादित कर सकते हैं। यदि दो लेनदेन परस्पर स्वतंत्र हैं और डेटा के विभिन्न खंडों पर काम कर रहे हैं, तो यह निष्पादन कोई नुकसान नहीं पहुंचाता है; लेकिन अगर ये दोनों लेनदेन एक ही डेटा पर काम कर रहे हैं, तो परिणाम भिन्न हो सकते हैं। यह कभी-अलग परिणाम डेटाबेस को असंगत स्थिति में ला सकता है।
इस समस्या को हल करने के लिए, हम एक लेन-देन अनुसूची के समानांतर निष्पादन की अनुमति देते हैं, यदि इसके लेनदेन या तो अनुक्रमिक हैं या उनके बीच कुछ तुलनीय संबंध हैं।
समतुल्य अनुसूचियां
एक समतुल्य अनुसूची निम्न प्रकार की हो सकती है -
परिणाम समतुल्यता
यदि निष्पादन के बाद दो शेड्यूल समान परिणाम उत्पन्न करते हैं, तो उन्हें परिणाम के बराबर कहा जाता है। वे कुछ मानों के लिए समान परिणाम और मूल्यों के एक और सेट के लिए अलग-अलग परिणाम प्राप्त कर सकते हैं। इसीलिए इस समानता को आम तौर पर महत्वपूर्ण नहीं माना जाता है।
समतुल्यता देखें
यदि दोनों अनुसूचियों में लेन-देन समान तरीके से किया जाता है, तो दो अनुसूचियाँ समतुल्य होंगी।
उदाहरण के लिए -
यदि T S1 में प्रारंभिक डेटा पढ़ता है, तो यह S2 में प्रारंभिक डेटा भी पढ़ता है।
यदि T S1 में J द्वारा लिखा गया मान पढ़ता है, तो यह S2 में J द्वारा लिखा गया मान भी पढ़ता है।
यदि T S1 में डेटा मूल्य पर अंतिम लेखन करता है, तो यह S2 में डेटा मूल्य पर अंतिम लेखन भी करता है।
संघर्ष समान
दो अनुसूचियां परस्पर विरोधी होंगी यदि उनके पास निम्नलिखित गुण हैं -
- दोनों अलग-अलग लेन-देन के हैं।
- दोनों एक ही डेटा आइटम तक पहुँचते हैं।
- कम से कम उनमें से एक "लिखना" ऑपरेशन है।
परस्पर विरोधी कार्यों के साथ कई लेन-देन वाले दो शेड्यूल के बारे में कहा जाता है कि यदि और केवल
- दोनों शेड्यूल में लेन-देन का एक ही सेट होता है।
- दोनों शेड्यूल में ऑपरेशन के परस्पर विरोधी जोड़े का क्रम बनाए रखा जाता है।
Note- समतुल्य शेड्यूल देखें सीरियल देखने योग्य हैं और विरोधाभास समतुल्य शेड्यूल विरोधाभासी अनुक्रमणीय हैं। सभी विरोधाभासी क्रमबद्ध कार्यक्रम क्रमिक रूप से देखे जा सकते हैं।
लेन-देन की अवस्थाएँ
डेटाबेस में लेनदेन निम्नलिखित राज्यों में से एक में हो सकता है -
Active- इस राज्य में, लेनदेन निष्पादित किया जा रहा है। यह हर लेन-देन की प्रारंभिक स्थिति है।
Partially Committed - जब कोई लेन-देन अपने अंतिम ऑपरेशन को अंजाम देता है, तो यह आंशिक रूप से प्रतिबद्ध अवस्था में होता है।
Failed- यदि डेटाबेस रिकवरी सिस्टम द्वारा किया गया कोई भी चेक विफल हो जाता है, तो लेनदेन को विफल स्थिति में कहा जाता है। एक विफल लेनदेन अब आगे नहीं बढ़ सकता है।
Aborted- यदि चेक में से कोई भी विफल हो जाता है और लेनदेन विफल स्थिति में पहुंच गया है, तो रिकवरी प्रबंधक डेटाबेस पर अपने सभी लिखित ऑपरेशन को वापस अपने मूल राज्य में वापस लाने के लिए रोल करता है जहां यह लेनदेन के निष्पादन से पहले था। इस अवस्था में लेनदेन को गर्भपात कहा जाता है। डेटाबेस पुनर्प्राप्ति मॉड्यूल लेन-देन गर्भपात के बाद दो कार्यों में से एक का चयन कर सकता है -
- लेन-देन फिर से शुरू करें
- लेन-देन को मार डालो
Committed- यदि कोई लेन-देन अपने सभी कार्यों को सफलतापूर्वक निष्पादित करता है, तो यह प्रतिबद्ध होने के लिए कहा जाता है। इसके सभी प्रभाव अब डेटाबेस सिस्टम पर स्थायी रूप से स्थापित हो गए हैं।
एक बहुपरत वातावरण में जहां एक साथ कई लेनदेन निष्पादित किए जा सकते हैं, लेन-देन की समाप्ती को नियंत्रित करना बहुत महत्वपूर्ण है। हमारे पास समवर्ती लेन-देन के लिए परमाणुता, अलगाव और क्रमबद्धता सुनिश्चित करने के लिए संगामिति नियंत्रण प्रोटोकॉल हैं। कंज़ेम्पर कंट्रोल प्रोटोकॉल को मोटे तौर पर दो श्रेणियों में विभाजित किया जा सकता है
- लॉक आधारित प्रोटोकॉल
- टाइम स्टैम्प आधारित प्रोटोकॉल
लॉक-आधारित प्रोटोकॉल
लॉक-आधारित प्रोटोकॉल से लैस डाटाबेस सिस्टम एक ऐसे तंत्र का उपयोग करता है जिसके द्वारा कोई भी लेनदेन डेटा को पढ़ या लिख नहीं सकता है जब तक कि वह उस पर एक उपयुक्त लॉक प्राप्त नहीं करता है। ताले दो प्रकार के होते हैं -
Binary Locks- डेटा आइटम पर एक लॉक दो राज्यों में हो सकता है; यह या तो लॉक या अनलॉक है।
Shared/exclusive- इस प्रकार का लॉकिंग तंत्र उनके उपयोग के आधार पर ताले को अलग करता है। यदि राइट ऑपरेशन करने के लिए डेटा आइटम पर एक लॉक प्राप्त किया जाता है, तो यह एक विशेष लॉक है। एक ही डेटा आइटम पर लिखने के लिए एक से अधिक लेनदेन की अनुमति डेटाबेस को असंगत स्थिति में ले जाएगी। पढ़ें ताले साझा किए जाते हैं क्योंकि कोई डेटा मूल्य नहीं बदला जा रहा है।
चार प्रकार के लॉक प्रोटोकॉल उपलब्ध हैं -
सरलीकृत ताला प्रोटोकॉल
सरलीकृत लॉक-आधारित प्रोटोकॉल लेनदेन को 'राइट' ऑपरेशन करने से पहले हर ऑब्जेक्ट पर लॉक प्राप्त करने की अनुमति देते हैं। लेनदेन 'राइट' ऑपरेशन को पूरा करने के बाद डेटा आइटम को अनलॉक कर सकते हैं।
प्री-क्लेम लॉक प्रोटोकॉल
पूर्व-दावा करने वाले प्रोटोकॉल उनके संचालन का मूल्यांकन करते हैं और उन डेटा आइटमों की एक सूची बनाते हैं जिन पर उन्हें ताले की आवश्यकता होती है। निष्पादन शुरू करने से पहले, लेन-देन उन सभी तालों के लिए सिस्टम का अनुरोध करता है जिनकी उसे पहले से आवश्यकता होती है। यदि सभी ताले प्रदान किए जाते हैं, तो लेन-देन निष्पादित होता है और इसके सभी संचालन समाप्त होने पर सभी ताले जारी करता है। यदि सभी ताले प्रदान नहीं किए जाते हैं, तो लेन-देन वापस आ जाता है और तब तक इंतजार करता है जब तक कि सभी ताले मंजूर नहीं हो जाते।
दो-चरण लॉकिंग 2PL
यह लॉकिंग प्रोटोकॉल लेनदेन के निष्पादन चरण को तीन भागों में विभाजित करता है। पहले भाग में, जब लेन-देन निष्पादित होने लगता है, तो इसके लिए आवश्यक तालों की अनुमति लेनी होती है। दूसरा भाग वह है जहां लेनदेन सभी तालों को प्राप्त करता है। जैसे ही लेनदेन अपना पहला लॉक जारी करता है, तीसरा चरण शुरू होता है। इस चरण में, लेन-देन किसी नए ताले की मांग नहीं कर सकता है; यह केवल अधिग्रहित ताले को जारी करता है।
दो-चरण लॉकिंग के दो चरण हैं, एक है growing, जहां सभी ताले लेनदेन द्वारा अधिग्रहित किए जा रहे हैं; और दूसरा चरण सिकुड़ रहा है, जहां लेनदेन द्वारा रखे गए ताले जारी किए जा रहे हैं।
अनन्य (राइट) लॉक का दावा करने के लिए, लेन-देन को पहले एक साझा (रीड) लॉक का अधिग्रहण करना होगा और फिर इसे एक विशेष लॉक में अपग्रेड करना होगा।
सख्त दो-चरण लॉकिंग
स्ट्रिक्ट -2PL का पहला चरण 2PL के समान है। पहले चरण में सभी ताले प्राप्त करने के बाद, लेन-देन सामान्य रूप से निष्पादित होता है। लेकिन 2PL के विपरीत, Strict-2PL उपयोग करने के बाद एक लॉक जारी नहीं करता है। सख्त -2PL कमिट पॉइंट तक सभी ताले रखता है और एक बार में सभी ताले जारी करता है।
सख्त -2PL में कैस्केडिंग गर्भपात नहीं है जैसा कि 2PL करता है।
टाइमस्टैम्प-आधारित प्रोटोकॉल
सबसे अधिक इस्तेमाल किया जाने वाला कंसीलर प्रोटोकॉल टाइमस्टैम्प आधारित प्रोटोकॉल है। यह प्रोटोकॉल टाइमस्टैम्प के रूप में या तो सिस्टम टाइम या लॉजिकल काउंटर का उपयोग करता है।
लॉक-आधारित प्रोटोकॉल, निष्पादन के समय लेनदेन के बीच परस्पर विरोधी जोड़े के बीच आदेश का प्रबंधन करते हैं, जबकि टाइमस्टैम्प-आधारित प्रोटोकॉल लेन-देन का निर्माण करते ही काम करना शुरू कर देते हैं।
हर लेन-देन में एक टाइमस्टैम्प जुड़ा होता है, और ऑर्डरिंग लेन-देन की उम्र से निर्धारित होती है। 0002 घड़ी के समय में बनाया गया एक लेन-देन इसके बाद आने वाले अन्य सभी लेनदेन की तुलना में पुराना होगा। उदाहरण के लिए, 0004 पर सिस्टम में प्रवेश करने वाला कोई भी लेनदेन 'y' दो सेकंड छोटा है और प्राथमिकता पुराने व्यक्ति को दी जाएगी।
इसके अलावा, प्रत्येक डेटा आइटम को नवीनतम रीड एंड राइट-टाइमस्टैम्प दिया जाता है। इससे सिस्टम को पता चलता है कि डेटा आइटम पर अंतिम 'रीड एंड राइट' ऑपरेशन कब किया गया था।
टाइमस्टैम्प ऑर्डरिंग प्रोटोकॉल
टाइमस्टैम्प-ऑर्डरिंग प्रोटोकॉल उनके परस्पर विरोधी पठन और लेखन कार्यों में लेनदेन के बीच क्रमबद्धता सुनिश्चित करता है। यह प्रोटोकॉल प्रणाली की जिम्मेदारी है कि लेनदेन के टाइमस्टैम्प मूल्यों के अनुसार कार्यों की परस्पर विरोधी जोड़ी को निष्पादित किया जाना चाहिए।
- लेन-देन T i का टाइमस्टैम्प TS (T i ) के रूप में दर्शाया गया है ।
- डेटा-आइटम एक्स का टाइम-स्टैम्प आर-टाइमस्टैम्प (एक्स) द्वारा दर्शाया गया है।
- W- टाइमस्टैम्प (X) द्वारा डेटा-आइटम X का टाइम-स्टैम्प निरूपित किया जाता है।
टाइमस्टैम्प ऑर्डरिंग प्रोटोकॉल निम्नानुसार काम करता है -
If a transaction Ti issues a read(X) operation −
- यदि टीएस (टीआई) <डब्ल्यू-टाइमस्टैम्प (एक्स)
- ऑपरेशन अस्वीकार कर दिया गया।
- यदि TS (Ti)> = W- टाइमस्टैम्प (X)
- ऑपरेशन को अंजाम दिया।
- सभी डेटा-आइटम टाइमस्टैम्प अपडेट किए गए।
If a transaction Ti issues a write(X) operation −
- यदि TS (Ti) <R-टाइमस्टैम्प (X)
- ऑपरेशन अस्वीकार कर दिया गया।
- यदि टीएस (टीआई) <डब्ल्यू-टाइमस्टैम्प (एक्स)
- ऑपरेशन खारिज कर दिया गया और टीआई वापस चला गया।
- अन्यथा, ऑपरेशन निष्पादित किया गया।
थॉमस 'नियम लिखें
यह नियम बताता है कि यदि टीएस (टीआई) <डब्ल्यू-टाइमस्टैम्प (एक्स) है, तो ऑपरेशन खारिज कर दिया जाता है और टी आई वापस रोल किया जाता है।
समय-क्रम के आदेश देने के नियमों को अनुसूची दृश्य को क्रमबद्ध बनाने के लिए संशोधित किया जा सकता है।
टी आई रोल बैक करने के बजाय , 'राइट' ऑपरेशन को ही नजरअंदाज कर दिया जाता है।
एक बहु-प्रक्रिया प्रणाली में, गतिरोध एक अवांछित स्थिति है जो एक साझा संसाधन वातावरण में उत्पन्न होती है, जहां एक प्रक्रिया अनिश्चित रूप से एक संसाधन के लिए प्रतीक्षा करती है जो किसी अन्य प्रक्रिया द्वारा होती है।
उदाहरण के लिए, लेनदेन का एक सेट मान लें {T 0 , T 1 , T 2 , ..., T n }। T 0 को अपना कार्य पूरा करने के लिए एक संसाधन X की आवश्यकता होती है। संसाधन X को T 1 द्वारा आयोजित किया जाता है , और T 1 एक संसाधन Y की प्रतीक्षा कर रहा है, जो T 2 के पास है । T 2 संसाधन Z की प्रतीक्षा कर रहा है, जो T 0 द्वारा आयोजित होता है । इस प्रकार, सभी प्रक्रियाएं संसाधनों को जारी करने के लिए एक दूसरे की प्रतीक्षा करती हैं। इस स्थिति में, कोई भी प्रक्रिया अपना कार्य पूरा नहीं कर सकती है। इस स्थिति को गतिरोध के रूप में जाना जाता है।
गतिरोध एक प्रणाली के लिए स्वस्थ नहीं हैं। यदि कोई सिस्टम गतिरोध में फंस जाता है, तो गतिरोध में शामिल लेनदेन या तो वापस ले लिए जाते हैं या फिर से चालू हो जाते हैं।
गतिरोध निवारण
सिस्टम में किसी भी गतिरोध की स्थिति को रोकने के लिए, डीबीएमएस आक्रामक रूप से उन सभी परिचालनों का निरीक्षण करता है, जहां लेनदेन निष्पादित होने वाले हैं। DBMS संचालन का निरीक्षण करता है और विश्लेषण करता है कि क्या वे गतिरोध की स्थिति बना सकते हैं। यदि यह पता चलता है कि गतिरोध की स्थिति उत्पन्न हो सकती है, तो उस लेनदेन को कभी भी निष्पादित नहीं होने दिया जाएगा।
गतिरोध की रोकथाम योजनाएँ हैं जो समय-सीमा के आदेश तंत्र का उपयोग करते हैं ताकि एक गतिरोध की स्थिति में पूर्व-निर्धारित हो।
रुको-मरो योजना
इस योजना में, यदि कोई लेन-देन किसी संसाधन (डेटा आइटम) को लॉक करने का अनुरोध करता है, जो पहले से ही किसी अन्य लेनदेन द्वारा परस्पर विरोधी लॉक के साथ होता है, तो दो में से एक संभावना हो सकती है -
यदि TS (T i ) <TS (T j ) - वह T i है , जो परस्पर विरोधी लॉक का अनुरोध कर रहा है, T j से पुराना है - तब T i को डेटा-आइटम उपलब्ध होने तक प्रतीक्षा करने की अनुमति है।
यदि TS (T i )> TS (t j ) - अर्थात T i , T j से छोटा है - तो T i मर जाता है। T i को बाद में एक यादृच्छिक विलंब के साथ लेकिन उसी टाइमस्टैम्प के साथ पुनः आरंभ किया जाता है।
यह योजना पुराने लेनदेन की प्रतीक्षा करने की अनुमति देती है लेकिन छोटे को मार देती है।
घायल-प्रतीक्षा योजना
इस योजना में, यदि लेन-देन किसी संसाधन (डेटा आइटम) को लॉक करने का अनुरोध करता है, जो पहले से ही कुछ अन्य लेनदेन द्वारा परस्पर विरोधी लॉक के साथ होता है, तो दो में से एक संभावना हो सकती है -
यदि टीएस (टी मैं ) <टीएस (टी जे ), तो टी मैं टी बलों जे वापस लुढ़का जा करने के लिए - यह है कि टी मैं घाव टी जे । टी जे को बाद में एक यादृच्छिक देरी के साथ फिर से शुरू किया जाता है लेकिन उसी टाइमस्टैम्प के साथ।
यदि टीएस (टी आई )> टीएस (टी जे ), तो टी आई को संसाधन उपलब्ध होने तक इंतजार करने के लिए मजबूर किया जाता है।
यह योजना, छोटे लेनदेन की प्रतीक्षा करने की अनुमति देती है; लेकिन जब एक पुराने लेन-देन में किसी छोटी के द्वारा रखी गई वस्तु का अनुरोध किया जाता है, तो पुराने लेन-देन से छोटी को गर्भपात करने और आइटम को छोड़ने के लिए मजबूर किया जाता है।
दोनों ही मामलों में, बाद के चरण में सिस्टम में प्रवेश करने वाले लेनदेन को निरस्त कर दिया जाता है।
गतिरोध से बचाव
लेनदेन को निरस्त करना हमेशा एक व्यावहारिक दृष्टिकोण नहीं है। इसके बजाय, डेडलॉक परिहार तंत्र का उपयोग अग्रिम में किसी भी गतिरोध की स्थिति का पता लगाने के लिए किया जा सकता है। "वेट-फॉर ग्राफ" जैसी विधियाँ उपलब्ध हैं लेकिन वे केवल उन्हीं प्रणालियों के लिए उपयुक्त हैं जहाँ लेनदेन हल्के होते हैं जिनमें संसाधन कम होते हैं। एक भारी प्रणाली में, गतिरोध की रोकथाम तकनीक अच्छी तरह से काम कर सकती है।
ग्राफ के लिए प्रतीक्षा करें
यदि कोई गतिरोध की स्थिति उत्पन्न हो सकती है तो यह ट्रैक करने के लिए एक सरल विधि उपलब्ध है। सिस्टम में प्रवेश करने वाले प्रत्येक लेनदेन के लिए, एक नोड बनाया जाता है। जब कोई लेन-देन T i किसी आइटम पर लॉक के लिए अनुरोध करता है, तो X का कहना है, जिसे कुछ अन्य लेनदेन T j द्वारा आयोजित किया जाता है , T i से T j तक एक निर्देशित बढ़त बनाई जाती है । यदि T j आइटम X को रिलीज़ करता है, तो उनके बीच का किनारा गिरा दिया जाता है और T i डेटा आइटम को लॉक कर देता है।
सिस्टम इस प्रतीक्षा-प्रतिचित्र को अन्य लेन-देन के लिए कुछ डेटा आइटम्स की प्रतीक्षा में प्रत्येक लेनदेन के लिए बनाए रखता है। यदि ग्राफ़ में कोई चक्र है, तो सिस्टम जाँच करता रहता है।
यहाँ, हम निम्नलिखित दो दृष्टिकोणों में से किसी का उपयोग कर सकते हैं -
सबसे पहले, किसी आइटम के लिए किसी भी अनुरोध को अनुमति न दें, जो पहले से ही किसी अन्य लेनदेन द्वारा बंद है। यह हमेशा संभव नहीं है और भुखमरी का कारण बन सकता है, जहां एक लेन-देन अनिश्चित रूप से एक डेटा आइटम का इंतजार करता है और इसे कभी भी अधिग्रहित नहीं कर सकता है।
दूसरा विकल्प लेन-देन में से एक को वापस करना है। यह हमेशा छोटे लेनदेन को वापस करने के लिए संभव नहीं है, क्योंकि यह पुराने की तुलना में महत्वपूर्ण हो सकता है। कुछ रिश्तेदार एल्गोरिदम की मदद से, एक लेनदेन चुना जाता है, जिसे गर्भपात करना होता है। यह लेनदेन के रूप में जाना जाता हैvictim और प्रक्रिया के रूप में जाना जाता है victim selection।
वाष्पशील भंडारण का नुकसान
रैम की तरह एक अस्थिर भंडारण सभी सक्रिय लॉग, डिस्क बफ़र और संबंधित डेटा संग्रहीत करता है। इसके अलावा, यह उन सभी लेनदेन को संग्रहीत करता है जो वर्तमान में निष्पादित हो रहे हैं। अगर इस तरह के वाष्पशील भंडारण से अचानक दुर्घटना हो जाए तो क्या होगा? यह स्पष्ट रूप से डेटाबेस के सभी लॉग और सक्रिय प्रतियां ले जाएगा। यह पुनर्प्राप्ति को लगभग असंभव बना देता है, क्योंकि डेटा को पुनर्प्राप्त करने के लिए आवश्यक सब कुछ खो जाता है।
अस्थिर भंडारण के नुकसान के मामले में निम्नलिखित तकनीकों को अपनाया जा सकता है -
हम ले सकते हैं checkpoints डेटाबेस की सामग्री को समय-समय पर सहेजने के लिए कई चरणों में।
अस्थिर मेमोरी में सक्रिय डेटाबेस की एक स्थिति समय-समय पर हो सकती है dumped एक स्थिर भंडारण पर, जिसमें लॉग और सक्रिय लेनदेन और बफर ब्लॉक भी हो सकते हैं।
जब भी डेटाबेस सामग्री को गैर-वाष्पशील मेमोरी से स्थिर एक तक डंप किया जाता है, तो लॉग फ़ाइल पर <डंप> को चिह्नित किया जा सकता है।
स्वास्थ्य लाभ
जब सिस्टम विफलता से ठीक हो जाता है, तो यह नवीनतम डंप को पुनर्स्थापित कर सकता है।
यह चौकियों के रूप में एक पुन: सूची और पूर्ववत सूची को बनाए रख सकता है।
यह अंतिम चेकपॉइंट तक सभी लेन-देन की स्थिति को पुनर्स्थापित करने के लिए पूर्व-पुनः सूची से परामर्श करके सिस्टम को पुनर्प्राप्त कर सकता है।
डेटाबेस बैकअप और भयावह विफलता से पुनर्प्राप्ति
एक भयावह विफलता वह है जहां एक स्थिर, द्वितीयक भंडारण उपकरण भ्रष्ट हो जाता है। स्टोरेज डिवाइस के साथ, अंदर संग्रहीत सभी मूल्यवान डेटा खो जाता है। ऐसी भयावह विफलता से डेटा पुनर्प्राप्त करने के लिए हमारे पास दो अलग-अलग रणनीतियाँ हैं -
रिमोट बैकअप & minu; यहां डेटाबेस की एक बैकअप प्रतिलिपि एक दूरस्थ स्थान पर संग्रहीत की जाती है, जहां से तबाही के मामले में इसे बहाल किया जा सकता है।
वैकल्पिक रूप से, डेटाबेस बैकअप को चुंबकीय टेप पर लिया जा सकता है और सुरक्षित स्थान पर संग्रहीत किया जा सकता है। बैकअप के बिंदु पर लाने के लिए इस बैकअप को बाद में एक ताज़ा स्थापित डेटाबेस पर स्थानांतरित किया जा सकता है।
ग्रो-अप डेटाबेस भी अक्सर बैकअप होने के लिए भारी होते हैं। ऐसे मामलों में, हमारे पास ऐसी तकनीकें हैं जहां हम डेटाबेस को केवल उसके लॉग को देखकर पुनर्स्थापित कर सकते हैं। तो, हम सभी को यहाँ करने की ज़रूरत है समय के लगातार अंतराल पर सभी लॉग का बैकअप लेने के लिए। डेटाबेस को सप्ताह में एक बार बैकअप किया जा सकता है, और लॉग बहुत छोटा होने पर हर दिन या जितनी बार संभव हो सके बैकअप लिया जा सकता है।
रिमोट बैकअप
दूरस्थ बैकअप सुरक्षा की भावना प्रदान करता है अगर प्राथमिक स्थान जहां डेटाबेस स्थित है नष्ट हो जाता है। रिमोट बैकअप ऑफ़लाइन या वास्तविक समय या ऑनलाइन हो सकता है। यदि यह ऑफ़लाइन है, तो इसे मैन्युअल रूप से बनाए रखा जाता है।
ऑनलाइन बैकअप सिस्टम डेटाबेस प्रशासकों और निवेशकों के लिए अधिक वास्तविक समय और जीवन रक्षक हैं। एक ऑनलाइन बैकअप सिस्टम एक ऐसा तंत्र है, जहाँ वास्तविक समय के हर डेटा को एक साथ दो दूर स्थानों पर बैकअप दिया जाता है। उनमें से एक सीधे सिस्टम से जुड़ा होता है और दूसरे को बैकअप के रूप में दूरस्थ स्थान पर रखा जाता है।
जैसे ही प्राथमिक डेटाबेस संग्रहण विफल होता है, बैकअप सिस्टम विफलता को भांप लेता है और उपयोगकर्ता सिस्टम को दूरस्थ संग्रहण पर स्विच करता है। कभी-कभी यह इतना त्वरित होता है कि उपयोगकर्ता विफलता का एहसास भी नहीं कर सकते हैं।
क्रैश रिकवरी
DBMS एक अत्यधिक जटिल प्रणाली है जिसमें हर सेकंड सैकड़ों लेनदेन को अंजाम दिया जाता है। DBMS की स्थायित्व और मजबूती इसकी जटिल वास्तुकला और इसके अंतर्निहित हार्डवेयर और सिस्टम सॉफ्टवेयर पर निर्भर करती है। यदि यह लेनदेन के बीच विफल या क्रैश हो जाता है, तो यह उम्मीद की जाती है कि सिस्टम खोए हुए डेटा को पुनर्प्राप्त करने के लिए किसी प्रकार के एल्गोरिथ्म या तकनीकों का पालन करेगा।
विफलता वर्गीकरण
यह देखने के लिए कि समस्या कहाँ हुई है, हम विभिन्न श्रेणियों में एक विफलता को सामान्य करते हैं, इस प्रकार है -
लेन-देन में विफलता
लेन-देन में विफल होने पर लेनदेन को समाप्त करना पड़ता है या जब यह उस बिंदु तक पहुंचता है जहां से यह आगे नहीं जा सकता है। इसे लेन-देन की विफलता कहा जाता है जहां केवल कुछ लेनदेन या प्रक्रियाएं आहत होती हैं।
लेनदेन की विफलता के कारण हो सकते हैं -
Logical errors - जहां कोई लेनदेन पूरा नहीं हो सकता क्योंकि इसमें कुछ कोड त्रुटि या कोई आंतरिक त्रुटि स्थिति है।
System errors- जहां डेटाबेस सिस्टम खुद एक सक्रिय लेनदेन को समाप्त कर देता है क्योंकि DBMS इसे निष्पादित करने में सक्षम नहीं है, या इसे कुछ सिस्टम स्थिति के कारण बंद करना पड़ता है। उदाहरण के लिए, गतिरोध या संसाधन अनुपलब्धता के मामले में, सिस्टम एक सक्रिय लेनदेन को रोक देता है।
सिस्टम खराब होना
सिस्टम के लिए समस्याएं हैं - बाहरी - जिससे सिस्टम अचानक बंद हो सकता है और सिस्टम क्रैश हो सकता है। उदाहरण के लिए, बिजली की आपूर्ति में रुकावट अंतर्निहित हार्डवेयर या सॉफ्टवेयर की विफलता का कारण हो सकती है।
उदाहरणों में ऑपरेटिंग सिस्टम की त्रुटियां शामिल हो सकती हैं।
डिस्क विफलता
प्रौद्योगिकी के विकास के शुरुआती दिनों में, यह एक आम समस्या थी जहां हार्ड-डिस्क ड्राइव या स्टोरेज ड्राइव अक्सर विफल होते थे।
डिस्क विफलताओं में खराब क्षेत्रों का निर्माण, डिस्क के प्रति असावधानी, डिस्क हेड क्रैश या कोई अन्य विफलता शामिल है, जो सभी या डिस्क स्टोरेज के एक हिस्से को नष्ट कर देती है।
भंडारण संरचना
हमने पहले ही स्टोरेज सिस्टम का वर्णन किया है। संक्षेप में, भंडारण संरचना को दो श्रेणियों में विभाजित किया जा सकता है -
Volatile storage- जैसा कि नाम से पता चलता है, एक अस्थिर भंडारण सिस्टम क्रैश से नहीं बच सकता है। वाष्पशील भंडारण उपकरणों को सीपीयू के बहुत करीब रखा जाता है; आम तौर पर वे चिपसेट पर ही एम्बेडेड होते हैं। उदाहरण के लिए, मुख्य मेमोरी और कैश मेमोरी अस्थिर भंडारण के उदाहरण हैं। वे तेज़ हैं लेकिन केवल थोड़ी मात्रा में जानकारी संग्रहीत कर सकते हैं।
Non-volatile storage- ये यादें सिस्टम क्रैश से बचने के लिए बनाई गई हैं। वे डेटा भंडारण क्षमता में विशाल हैं, लेकिन पहुंच में धीमी हैं। उदाहरणों में हार्ड-डिस्क, चुंबकीय टेप, फ्लैश मेमोरी और गैर-वाष्पशील (बैटरी बैक अप) रैम शामिल हो सकते हैं।
रिकवरी और एटमॉसिटी
जब कोई सिस्टम क्रैश होता है, तो इसमें कई लेनदेन निष्पादित हो सकते हैं और डेटा आइटम को संशोधित करने के लिए उनके लिए विभिन्न फाइलें खोली जाती हैं। लेन-देन विभिन्न कार्यों से बने होते हैं, जो प्रकृति में परमाणु हैं। लेकिन डीबीएमएस के एसीआईडी गुणों के अनुसार, एक पूरे के रूप में लेन-देन की परमाणुता को बनाए रखा जाना चाहिए, अर्थात, या तो सभी संचालन निष्पादित किए जाते हैं या कोई भी नहीं।
जब एक DBMS एक दुर्घटना से उबरता है, तो इसे निम्नलिखित बनाए रखना चाहिए -
इसमें उन सभी लेनदेन की स्थिति की जांच होनी चाहिए, जिन्हें निष्पादित किया जा रहा था।
एक लेनदेन कुछ ऑपरेशन के बीच में हो सकता है; DBMS को इस मामले में लेनदेन की परमाणुता सुनिश्चित करनी चाहिए।
यह जांचना चाहिए कि क्या लेनदेन अभी पूरा हो सकता है या इसे वापस रोल करने की आवश्यकता है।
किसी भी लेनदेन को असंगत स्थिति में DBMS छोड़ने की अनुमति नहीं होगी।
दो प्रकार की तकनीकें हैं, जो एक लेनदेन की परमाणुता को बनाए रखने के साथ-साथ उबरने में मदद कर सकती हैं -
वास्तव में डेटाबेस को संशोधित करने से पहले प्रत्येक लेनदेन के लॉग को बनाए रखना, और उन्हें कुछ स्थिर भंडारण पर लिखना।
शैडो पेजिंग को बनाए रखना, जहां परिवर्तन एक अस्थिर मेमोरी पर किए जाते हैं, और बाद में, वास्तविक डेटाबेस को अपडेट किया जाता है।
लॉग-आधारित पुनर्प्राप्ति
लॉग रिकॉर्ड का एक क्रम है, जो एक लेनदेन द्वारा किए गए कार्यों के रिकॉर्ड को बनाए रखता है। यह महत्वपूर्ण है कि लॉग वास्तविक संशोधन से पहले लिखे गए हैं और एक स्थिर भंडारण मीडिया पर संग्रहीत हैं, जो कि विफल है।
लॉग-आधारित रिकवरी निम्नानुसार काम करती है -
लॉग फ़ाइल को स्थिर भंडारण मीडिया पर रखा जाता है।
जब कोई लेनदेन सिस्टम में प्रवेश करता है और निष्पादन शुरू करता है, तो वह इसके बारे में एक लॉग लिखता है।
<Tn, Start>
जब लेनदेन किसी आइटम X को संशोधित करता है, तो वह लॉग निम्नानुसार लिखता है -
<Tn, X, V1, V2>
यह पढ़ता है कि T n ने X का मान V 1 से V 2 तक बदल दिया है ।
- जब लेन-देन खत्म हो जाता है, तो यह लॉग होता है -
<Tn, commit>
दो दृष्टिकोणों का उपयोग करके डेटाबेस को संशोधित किया जा सकता है -
Deferred database modification - सभी लॉग स्थिर भंडारण पर लिखे जाते हैं और लेनदेन शुरू होने पर डेटाबेस को अपडेट किया जाता है।
Immediate database modification- प्रत्येक लॉग एक वास्तविक डेटाबेस संशोधन का अनुसरण करता है। यही है, हर ऑपरेशन के तुरंत बाद डेटाबेस को संशोधित किया जाता है।
समवर्ती लेनदेन के साथ वसूली
जब एक से अधिक लेनदेन समानांतर में निष्पादित किए जा रहे हैं, तो लॉग्स को इंटरलेय किया जाता है। पुनर्प्राप्ति के समय, पुनर्प्राप्ति प्रणाली के लिए सभी लॉग को पीछे करना कठिन हो जाएगा, और फिर ठीक होना शुरू हो जाएगा। इस स्थिति को कम करने के लिए, अधिकांश आधुनिक डीबीएमएस 'चौकियों' की अवधारणा का उपयोग करते हैं।
जांच की चौकी
वास्तविक समय और वास्तविक वातावरण में लॉग को रखना और बनाए रखना सिस्टम में उपलब्ध सभी मेमोरी स्पेस को भर सकता है। जैसे-जैसे समय बीतता है, लॉग फ़ाइल बहुत बड़ी हो सकती है जिसे सभी को संभाला जाए। चेकपॉइंट एक ऐसा तंत्र है जहां पिछले सभी लॉग सिस्टम से हटा दिए जाते हैं और स्टोरेज डिस्क में स्थायी रूप से संग्रहीत होते हैं। चेकपॉइंट एक बिंदु घोषित करता है, जिसके पहले DBMS सुसंगत स्थिति में था, और सभी लेनदेन प्रतिबद्ध थे।
स्वास्थ्य लाभ
जब समवर्ती लेन-देन वाली प्रणाली क्रैश हो जाती है और ठीक हो जाती है, तो यह निम्नलिखित तरीके से व्यवहार करता है -
रिकवरी सिस्टम लॉग को पीछे से अंतिम चेकपॉइंट पर पढ़ता है।
यह दो सूचियों, एक पूर्व-सूची और एक पुनः-सूची को बनाए रखता है।
यदि पुनर्प्राप्ति प्रणाली <T n , प्रारंभ> और <T n , कमिट> या बस <T n , कमिट> के साथ लॉग देखती है , तो यह लेन-देन को पुन: सूची में डालती है।
यदि पुनर्प्राप्ति प्रणाली एक लॉग को <T n , प्रारंभ> के साथ देखती है , लेकिन कोई कमिट या गर्भपात लॉग नहीं मिला, तो यह लेन-देन को पूर्ववत सूची में डाल देता है।
पूर्व-सूची में सभी लेनदेन तब पूर्ववत हैं और उनके लॉग हटा दिए जाते हैं। Redo-list और उनके पिछले लॉग में किए गए सभी लेन-देन को हटा दिया जाता है और फिर उनके लॉग सहेजने से पहले रीडऑन किया जाता है।