डेटा वेयरहाउसिंग - सुरक्षा
डेटा वेयरहाउस का उद्देश्य उपयोगकर्ताओं को बड़ी मात्रा में डेटा आसानी से उपलब्ध कराना है, इसलिए उपयोगकर्ताओं को व्यवसाय के बारे में जानकारी निकालने की अनुमति देता है। लेकिन हम जानते हैं कि डेटा पर कुछ सुरक्षा प्रतिबंध लागू हो सकते हैं जो जानकारी तक पहुंचने में बाधा बन सकते हैं। यदि विश्लेषक के पास डेटा का प्रतिबंधित दृष्टिकोण है, तो व्यवसाय के भीतर रुझानों की एक पूरी तस्वीर को पकड़ना असंभव है।
प्रत्येक विश्लेषक के डेटा को सारांशित किया जा सकता है और प्रबंधन को पास किया जा सकता है जहां विभिन्न सारांश एकत्र किए जा सकते हैं। जैसा कि सारांश के एकत्रीकरण पूरे के रूप में एकत्रीकरण के समान नहीं हो सकते हैं, डेटा में कुछ जानकारी के रुझानों को याद करना संभव है जब तक कि कोई व्यक्ति समग्र रूप से डेटा का विश्लेषण नहीं कर रहा है।
सुरक्षा आवश्यकताएँ
सुरक्षा सुविधाओं को जोड़ने से डेटा वेयरहाउस का प्रदर्शन प्रभावित होता है, इसलिए जितनी जल्दी हो सके सुरक्षा आवश्यकताओं को निर्धारित करना महत्वपूर्ण है। डेटा वेयरहाउस के लाइव होने के बाद सुरक्षा सुविधाओं को जोड़ना मुश्किल है।
डेटा वेयरहाउस के डिज़ाइन चरण के दौरान, हमें यह ध्यान रखना चाहिए कि डेटा स्रोतों को बाद में क्या जोड़ा जा सकता है और उन डेटा स्रोतों को जोड़ने का क्या प्रभाव होगा। हमें डिजाइन चरण के दौरान निम्नलिखित संभावनाओं पर विचार करना चाहिए।
क्या नए डेटा स्रोतों को लागू करने के लिए नई सुरक्षा और / या ऑडिट प्रतिबंधों की आवश्यकता होगी?
क्या नए उपयोगकर्ता जोड़े गए हैं जिनके पास पहले से उपलब्ध डेटा तक सीमित है?
यह स्थिति तब उत्पन्न होती है जब भविष्य के उपयोगकर्ता और डेटा स्रोत अच्छी तरह से ज्ञात नहीं होते हैं। ऐसी स्थिति में, हमें संभावित आवश्यकताओं को जानने के लिए व्यापार के ज्ञान और डेटा वेयरहाउस के उद्देश्य का उपयोग करने की आवश्यकता है।
सुरक्षा गतिविधियों से निम्नलिखित गतिविधियाँ प्रभावित होती हैं -
- उपयोगकर्ता की पहुंच
- डेटा लोड
- डेटा आंदोलन
- क्वेरी पीढ़ी
उपयोगकर्ता की पहुंच
हमें पहले डेटा को वर्गीकृत करने की आवश्यकता है और फिर उपयोगकर्ताओं को उन डेटा के आधार पर वर्गीकृत कर सकते हैं जो वे एक्सेस कर सकते हैं। दूसरे शब्दों में, उपयोगकर्ताओं को उन डेटा के अनुसार वर्गीकृत किया जा सकता है जिन्हें वे एक्सेस कर सकते हैं।
Data Classification
डेटा को वर्गीकृत करने के लिए निम्नलिखित दो तरीकों का उपयोग किया जा सकता है -
डेटा को उसकी संवेदनशीलता के अनुसार वर्गीकृत किया जा सकता है। अत्यधिक संवेदनशील डेटा को अत्यधिक प्रतिबंधित के रूप में वर्गीकृत किया गया है और कम-संवेदनशील डेटा को कम प्रतिबंधक के रूप में वर्गीकृत किया गया है।
डाटा को जॉब फंक्शन के अनुसार भी वर्गीकृत किया जा सकता है। यह प्रतिबंध केवल विशिष्ट उपयोगकर्ताओं को विशेष डेटा देखने की अनुमति देता है। यहां हम उपयोगकर्ताओं को केवल उस डेटा के उस हिस्से को देखने के लिए प्रतिबंधित करते हैं जिसमें वे रुचि रखते हैं और इसके लिए जिम्मेदार हैं।
दूसरे दृष्टिकोण में कुछ मुद्दे हैं। समझने के लिए, आइए एक उदाहरण देखें। मान लीजिए कि आप बैंक के लिए डेटा वेयरहाउस बना रहे हैं। विचार करें कि डेटा वेयरहाउस में संग्रहीत डेटा सभी खातों के लिए लेनदेन डेटा है। यहां सवाल यह है कि लेनदेन डेटा को देखने की अनुमति किसको है। समाधान फ़ंक्शन के अनुसार डेटा को वर्गीकृत करने में निहित है।
User classification
निम्नलिखित दृष्टिकोण का उपयोग उपयोगकर्ताओं को वर्गीकृत करने के लिए किया जा सकता है -
उपयोगकर्ताओं को एक संगठन में उपयोगकर्ताओं के पदानुक्रम के अनुसार वर्गीकृत किया जा सकता है, अर्थात, उपयोगकर्ताओं को विभागों, वर्गों, समूहों और इसी तरह से वर्गीकृत किया जा सकता है।
उपयोगकर्ताओं को उनकी भूमिका के आधार पर वर्गीकृत किया जा सकता है, उनकी भूमिका के आधार पर विभागों में समूहीकृत लोगों के साथ।
Classification on basis of Department
चलो एक डेटा गोदाम का एक उदाहरण है जहां उपयोगकर्ता बिक्री और विपणन विभाग से हैं। हम अलग-अलग विभागों पर केंद्रित पहुंच के साथ कंपनी के टॉप-डाउन-डाउन कंपनी के दृष्टिकोण से सुरक्षा कर सकते हैं। लेकिन विभिन्न स्तरों पर उपयोगकर्ताओं पर कुछ प्रतिबंध हो सकते हैं। इस संरचना को निम्नलिखित चित्र में दिखाया गया है।
लेकिन अगर प्रत्येक विभाग अलग-अलग डेटा एक्सेस करता है, तो हमें प्रत्येक विभाग के लिए सुरक्षा एक्सेस अलग से डिज़ाइन करना चाहिए। यह विभागीय डेटा marts द्वारा प्राप्त किया जा सकता है। चूंकि ये डेटा मौसा डेटा वेयरहाउस से अलग होते हैं, इसलिए हम प्रत्येक डेटा मार्ट पर अलग-अलग सुरक्षा प्रतिबंध लागू कर सकते हैं। यह दृष्टिकोण निम्नलिखित आकृति में दिखाया गया है।
Classification Based on Role
यदि डेटा आम तौर पर सभी विभागों के लिए उपलब्ध है, तो भूमिका अभिगमन पदानुक्रम का पालन करना उपयोगी है। दूसरे शब्दों में, यदि डेटा आमतौर पर सभी विभागों द्वारा एक्सेस किया जाता है, तो उपयोगकर्ता की भूमिका के अनुसार सुरक्षा प्रतिबंध लागू करें। भूमिका चित्र पदानुक्रम निम्नलिखित आकृति में दिखाया गया है।
ऑडिट आवश्यकताएँ
लेखा परीक्षा सुरक्षा का एक सबसेट है, एक महंगी गतिविधि है। ऑडिटिंग सिस्टम पर भारी ओवरहेड्स का कारण बन सकता है। समय में एक ऑडिट को पूरा करने के लिए, हमें अधिक हार्डवेयर की आवश्यकता होती है और इसलिए, यह अनुशंसा की जाती है कि जहां भी संभव हो, ऑडिटिंग को बंद कर दिया जाए। लेखापरीक्षा आवश्यकताओं को निम्नानुसार वर्गीकृत किया जा सकता है -
- Connections
- Disconnections
- डेटा प्राप्त करना
- डेटा परिवर्तन
Note- उपर्युक्त श्रेणियों में से प्रत्येक के लिए, सफलता, विफलता या दोनों का ऑडिट करना आवश्यक है। सुरक्षा कारणों के दृष्टिकोण से, विफलताओं की ऑडिटिंग बहुत महत्वपूर्ण है। विफलता का ऑडिट करना महत्वपूर्ण है क्योंकि वे अनधिकृत या धोखाधड़ी की पहुंच को उजागर कर सकते हैं।
नेटवर्क आवश्यकताएँ
नेटवर्क सुरक्षा अन्य प्रतिभूतियों की तरह ही महत्वपूर्ण है। हम नेटवर्क सुरक्षा आवश्यकता को अनदेखा नहीं कर सकते। हमें निम्नलिखित मुद्दों पर विचार करने की आवश्यकता है -
क्या डेटा वेयरहाउस में स्थानांतरित करने से पहले डेटा को एन्क्रिप्ट करना आवश्यक है?
क्या ऐसे नेटवर्क पर प्रतिबंध हैं जो डेटा ले सकते हैं?
इन प्रतिबंधों को ध्यान से विचार करने की आवश्यकता है। याद रखने के लिए निम्नलिखित बिंदु हैं -
एन्क्रिप्शन और डिक्रिप्शन की प्रक्रिया ओवरहेड्स को बढ़ाएगी। इसके लिए अधिक प्रसंस्करण शक्ति और प्रसंस्करण समय की आवश्यकता होगी।
यदि सिस्टम पहले से लोड सिस्टम है क्योंकि एन्क्रिप्शन की लागत अधिक हो सकती है क्योंकि एन्क्रिप्शन स्रोत सिस्टम द्वारा वहन किया जाता है।
डेटा आंदोलन
डेटा को स्थानांतरित करते समय संभावित सुरक्षा निहितार्थ मौजूद हैं। मान लीजिए कि हमें लोड होने के लिए फ्लैट फ़ाइल के रूप में कुछ प्रतिबंधित डेटा को स्थानांतरित करने की आवश्यकता है। जब डेटा को डेटा वेयरहाउस में लोड किया जाता है, तो निम्नलिखित प्रश्न उठाए जाते हैं -
- फ्लैट फ़ाइल कहाँ संग्रहीत की जाती है?
- उस डिस्क स्थान तक किसकी पहुंच है?
अगर हम इन फ्लैट फ़ाइलों के बैकअप के बारे में बात करते हैं, तो निम्नलिखित प्रश्न उठाए जाते हैं -
- क्या आप एन्क्रिप्टेड या डिक्रिप्टेड संस्करणों का बैकअप लेते हैं?
- क्या इन बैकअप को विशेष टेपों के लिए बनाया जाना चाहिए जो अलग-अलग संग्रहीत हैं?
- इन टेपों की पहुंच किसके पास है?
डेटा आंदोलन के कुछ अन्य रूपों जैसे क्वेरी परिणाम सेट पर भी विचार करने की आवश्यकता है। अस्थायी तालिका बनाते समय उठाए गए प्रश्न इस प्रकार हैं -
- वह अस्थायी तालिका कहाँ रखी जानी है?
- आप इस तरह की तालिका को कैसे देखते हैं?
हमें सुरक्षा प्रतिबंधों के आकस्मिक प्रवाह से बचना चाहिए। यदि प्रतिबंधित डेटा तक पहुंच वाला उपयोगकर्ता सुलभ अस्थायी टेबल उत्पन्न कर सकता है, तो डेटा गैर-अधिकृत उपयोगकर्ताओं को दिखाई दे सकता है। हम प्रतिबंधित डेटा तक पहुंच वाले उपयोगकर्ताओं के लिए एक अलग अस्थायी क्षेत्र होने से इस समस्या को दूर कर सकते हैं।
प्रलेखन
ऑडिट और सुरक्षा आवश्यकताओं को ठीक से प्रलेखित करने की आवश्यकता है। इसे औचित्य के एक भाग के रूप में माना जाएगा। इस दस्तावेज़ में सभी जानकारी एकत्र की जा सकती है -
- डेटा वर्गीकरण
- उपयोगकर्ता वर्गीकरण
- नेटवर्क आवश्यकताओं
- डेटा आंदोलन और भंडारण आवश्यकताओं
- सभी श्रव्य क्रियाएं
डिजाइन पर सुरक्षा का प्रभाव
सुरक्षा एप्लिकेशन कोड और विकास के समय को प्रभावित करती है। सुरक्षा निम्नलिखित क्षेत्र को प्रभावित करती है -
- एप्लीकेशन का विकास
- डेटाबेस डिजाइन
- Testing
एप्लीकेशन का विकास
सुरक्षा समग्र अनुप्रयोग विकास को प्रभावित करती है और यह डेटा वेयरहाउस के महत्वपूर्ण घटकों जैसे लोड मैनेजर, वेयरहाउस मैनेजर और क्वेरी मैनेजर के डिज़ाइन को भी प्रभावित करती है। लोड मैनेजर को रिकॉर्ड को फ़िल्टर करने और उन्हें विभिन्न स्थानों पर रखने के लिए चेक कोड की आवश्यकता हो सकती है। कुछ डेटा छिपाने के लिए अधिक परिवर्तन नियमों की भी आवश्यकता हो सकती है। इसके अलावा किसी भी अतिरिक्त वस्तुओं को संभालने के लिए अतिरिक्त मेटाडेटा की आवश्यकताएं हो सकती हैं।
अतिरिक्त दृश्य बनाने और बनाए रखने के लिए, गोदाम प्रबंधक को सुरक्षा लागू करने के लिए अतिरिक्त कोड की आवश्यकता हो सकती है। अतिरिक्त चेक को डेटा वेयरहाउस में कोडित किया जा सकता है ताकि इसे डेटा को किसी ऐसे स्थान पर स्थानांतरित करने से रोका जा सके जहां यह उपलब्ध नहीं होना चाहिए। क्वेरी प्रबंधक को किसी भी एक्सेस प्रतिबंध को संभालने के लिए परिवर्तनों की आवश्यकता होती है। क्वेरी प्रबंधक को सभी अतिरिक्त विचारों और एकत्रीकरण के बारे में पता होना चाहिए।
डेटाबेस डिजाइन
डेटाबेस लेआउट भी प्रभावित होता है क्योंकि जब सुरक्षा उपायों को लागू किया जाता है, तो विचारों और तालिकाओं की संख्या में वृद्धि होती है। सुरक्षा जोड़ने से डेटाबेस का आकार बढ़ जाता है और इसलिए डेटाबेस डिज़ाइन और प्रबंधन की जटिलता बढ़ जाती है। यह बैकअप प्रबंधन और पुनर्प्राप्ति योजना में जटिलता भी जोड़ देगा।
परिक्षण
डेटा वेयरहाउस का परीक्षण एक जटिल और लंबी प्रक्रिया है। डेटा वेयरहाउस में सुरक्षा जोड़ना परीक्षण समय की जटिलता को भी प्रभावित करता है। यह निम्नलिखित दो तरीकों से परीक्षण को प्रभावित करता है -
यह एकीकरण और सिस्टम परीक्षण के लिए आवश्यक समय बढ़ाएगा।
परीक्षण किए जाने के लिए अतिरिक्त कार्यक्षमता है जो परीक्षण सूट के आकार को बढ़ाएगा।