डाटा माइनिंग - सिस्टम
डेटा माइनिंग सिस्टम की एक विशाल विविधता उपलब्ध है। डेटा माइनिंग सिस्टम निम्नलिखित से तकनीकों को एकीकृत कर सकते हैं -
- स्थानिक डेटा विश्लेषण
- सूचना पुनर्प्राप्ति
- पैटर्न मान्यता
- छवि विश्लेषण
- संकेत प्रसंस्करण
- कंप्यूटर ग्राफिक्स
- वेब प्रौद्योगिकी
- Business
- Bioinformatics
डाटा माइनिंग सिस्टम वर्गीकरण
एक डाटा माइनिंग सिस्टम को निम्न मानदंडों के अनुसार वर्गीकृत किया जा सकता है -
- डेटाबेस प्रौद्योगिकी
- Statistics
- मशीन लर्निंग
- सूचना विज्ञान
- Visualization
- अन्य अनुशासन
इनके अलावा, डेटा खनन प्रणाली को भी वर्गीकृत किया जा सकता है (ए) डेटाबेस खनन, (बी) ज्ञान खनन, (सी) तकनीकों का उपयोग किया, और (डी) अनुप्रयोगों अनुकूलित।
डेटाबेस खनन के आधार पर वर्गीकरण
हम खनन किए गए डेटाबेस के प्रकार के अनुसार डेटा माइनिंग सिस्टम को वर्गीकृत कर सकते हैं। डेटाबेस सिस्टम को विभिन्न मानदंडों के अनुसार वर्गीकृत किया जा सकता है जैसे डेटा मॉडल, डेटा के प्रकार, आदि। और डेटा माइनिंग सिस्टम को तदनुसार वर्गीकृत किया जा सकता है।
उदाहरण के लिए, यदि हम डेटा मॉडल के अनुसार डेटाबेस को वर्गीकृत करते हैं, तो हमारे पास रिलेशनल, ट्रांजेक्शनल, ऑब्जेक्ट-रिलेशनल या डेटा वेयरहाउस माइनिंग सिस्टम हो सकता है।
वर्गीकरण ज्ञान के प्रकार पर आधारित है
हम खनन किए गए ज्ञान के अनुसार डेटा माइनिंग सिस्टम को वर्गीकृत कर सकते हैं। इसका अर्थ है कि डेटा माइनिंग सिस्टम को कार्यात्मकताओं के आधार पर वर्गीकृत किया जाता है जैसे -
- Characterization
- Discrimination
- एसोसिएशन और सहसंबंध विश्लेषण
- Classification
- Prediction
- बाह्य विश्लेषण
- विकास विश्लेषण
वर्गीकृत तकनीक के आधार पर वर्गीकरण
हम जिस तरह की तकनीक का इस्तेमाल करते हैं, उसके हिसाब से डेटा माइनिंग सिस्टम को वर्गीकृत कर सकते हैं। हम इन तकनीकों का वर्णन कर सकते हैं जिसमें शामिल उपयोगकर्ता बातचीत की डिग्री या नियोजित विश्लेषण के तरीके हैं।
वर्गीकृत किए गए अनुप्रयोगों के आधार पर वर्गीकरण
हम अनुकूलित किए गए अनुप्रयोगों के अनुसार डेटा खनन प्रणाली को वर्गीकृत कर सकते हैं। ये आवेदन इस प्रकार हैं -
- Finance
- Telecommunications
- DNA
- शेयर बाजार
एक DB / DW प्रणाली के साथ एक डाटा खनन प्रणाली का घालमेल
यदि कोई डेटा माइनिंग सिस्टम डेटाबेस या डेटा वेयरहाउस सिस्टम के साथ एकीकृत नहीं है, तो उसके साथ संवाद करने के लिए कोई सिस्टम नहीं होगा। इस योजना को गैर-युग्मन योजना के रूप में जाना जाता है। इस योजना में, मुख्य ध्यान डेटा खनन डिजाइन पर और उपलब्ध डेटा सेटों के खनन के लिए कुशल और प्रभावी एल्गोरिदम विकसित करने पर है।
एकीकरण योजनाओं की सूची इस प्रकार है -
No Coupling- इस योजना में, डेटा माइनिंग सिस्टम किसी भी डेटाबेस या डेटा वेयरहाउस फ़ंक्शन का उपयोग नहीं करता है। यह एक विशेष स्रोत से डेटा प्राप्त करता है और कुछ डेटा माइनिंग एल्गोरिदम का उपयोग करके उस डेटा को संसाधित करता है। डेटा माइनिंग रिजल्ट दूसरी फाइल में स्टोर हो जाता है।
Loose Coupling- इस योजना में, डेटा माइनिंग सिस्टम डेटाबेस और डेटा वेयरहाउस सिस्टम के कुछ कार्यों का उपयोग कर सकता है। यह इन प्रणालियों द्वारा प्रबंधित डेटा श्वसन से डेटा प्राप्त करता है और उस डेटा पर डेटा खनन करता है। यह तब खनन परिणाम को एक फ़ाइल में या डेटाबेस में या डेटा वेयरहाउस में निर्दिष्ट स्थान पर संग्रहीत करता है।
Semi−tight Coupling - इस योजना में, डेटा माइनिंग सिस्टम को डेटाबेस या डेटा वेयरहाउस सिस्टम के साथ जोड़ा जाता है और इसके अलावा, डेटाबेस में कुछ डेटा माइनिंग प्राइमेटिव के कुशल कार्यान्वयन प्रदान किए जा सकते हैं।
Tight coupling- इस युग्मन योजना में, डेटा माइनिंग सिस्टम को डेटाबेस या डेटा वेयरहाउस सिस्टम में आसानी से एकीकृत किया जाता है। डेटा माइनिंग सबसिस्टम को सूचना प्रणाली के एक कार्यात्मक घटक के रूप में माना जाता है।