डेटा विश्लेषण - अवलोकन

डेटा विश्लेषण उपयोगी जानकारी की खोज, निष्कर्ष का सुझाव देने और निर्णय लेने का समर्थन करने के लक्ष्य के साथ डेटा का निरीक्षण, सफाई, रूपांतरण और मॉडलिंग करने की एक प्रक्रिया है।

डेटा विश्लेषण के प्रकार

कई डेटा विश्लेषण तकनीकों में विभिन्न डोमेन जैसे व्यवसाय, विज्ञान, सामाजिक विज्ञान आदि शामिल हैं, जिनमें कई नाम हैं। प्रमुख डेटा विश्लेषण दृष्टिकोण हैं -

  • डेटा माइनिंग
  • व्यापारिक सूचना
  • सांख्यिकीय विश्लेषण
  • भविष्यिक विश्लेषण
  • पाठ विश्लेषण

डेटा माइनिंग

डेटा माइनिंग पहले अज्ञात, डेटा के दिलचस्प पैटर्न, असामान्य डेटा और निर्भरताओं को निकालने के लिए बड़ी मात्रा में डेटा का विश्लेषण है। ध्यान दें कि लक्ष्य बड़ी मात्रा में डेटा से पैटर्न और ज्ञान का निष्कर्षण है न कि डेटा का निष्कर्षण।

डाटा माइनिंग एनालिसिस में आर्टिफिशियल इंटेलिजेंस, मशीन लर्निंग, स्टैटिस्टिक्स और डेटाबेस सिस्टम के चौराहे पर कंप्यूटर साइंस के तरीके शामिल हैं।

डेटा माइनिंग से प्राप्त पैटर्न को इनपुट डेटा के सारांश के रूप में माना जा सकता है जिसका उपयोग आगे के विश्लेषण में किया जा सकता है या निर्णय समर्थन प्रणाली द्वारा अधिक सटीक भविष्यवाणी परिणाम प्राप्त करने के लिए किया जा सकता है।

व्यापारिक सूचना

बिजनेस इंटेलिजेंस तकनीक और उपकरण नए रणनीतिक व्यावसायिक अवसरों की पहचान करने, विकसित करने और बनाने में मदद करने के लिए बड़ी मात्रा में असंरचित व्यावसायिक डेटा के अधिग्रहण और परिवर्तन के लिए हैं।

व्यापार खुफिया का लक्ष्य नए अवसरों की पहचान करने के लिए बड़ी मात्रा में डेटा की आसान व्याख्या की अनुमति देना है। यह अंतर्दृष्टि के आधार पर एक प्रभावी रणनीति को लागू करने में मदद करता है जो प्रतिस्पर्धी बाजार-लाभ और दीर्घकालिक स्थिरता के साथ कारोबार प्रदान कर सकता है।

सांख्यिकीय विश्लेषण

सांख्यिकी डेटा के संग्रह, विश्लेषण, व्याख्या, प्रस्तुति और संगठन का अध्ययन है।

डेटा विश्लेषण में, दो मुख्य सांख्यिकीय पद्धतियों का उपयोग किया जाता है -

  • Descriptive statistics - वर्णनात्मक आंकड़ों में, संपूर्ण जनसंख्या के डेटा या एक नमूने को संख्यात्मक विवरणों के साथ संक्षेपित किया जाता है जैसे कि -

    • मीन, कंटीन्यूअस डेटा के लिए स्टैंडर्ड डिविएशन

    • आवृत्ति, श्रेणीबद्ध डेटा के लिए प्रतिशत

  • Inferential statistics- यह नमूना डेटा में प्रतिमानों का प्रतिनिधित्व करते हैं या यादृच्छिकता के लिए प्रतिनिधित्व जनसंख्या के बारे में निष्कर्ष निकालने के लिए उपयोग करता है। ये निष्कर्ष हो सकते हैं -

    • डेटा के बारे में हां / नहीं के सवालों का जवाब देना (परिकल्पना परीक्षण)

    • आंकडों की संख्यात्मक विशेषताओं का आकलन (अनुमान)

    • डेटा के भीतर संघों का वर्णन (सहसंबंध)

    • डेटा के भीतर मॉडलिंग के रिश्ते (जैसे प्रतिगमन विश्लेषण)

भविष्यिक विश्लेषण

भविष्य कहनेवाला विश्लेषण भविष्य या अन्यथा अज्ञात घटनाओं के बारे में पूर्वानुमान (पूर्वानुमान) के लिए वर्तमान और ऐतिहासिक डेटा का विश्लेषण करने के लिए सांख्यिकीय मॉडल का उपयोग करता है। व्यवसाय में, भविष्य कहनेवाला विश्लेषण का उपयोग जोखिमों और अवसरों की पहचान करने के लिए किया जाता है जो निर्णय लेने में सहायता करते हैं।

पाठ विश्लेषण

टेक्स्ट एनालिटिक्स, जिसे टेक्स्ट माइनिंग या टेक्स्ट डेटा माइनिंग के रूप में भी जाना जाता है, पाठ से उच्च-गुणवत्ता की जानकारी प्राप्त करने की प्रक्रिया है। टेक्स्ट माइनिंग में आमतौर पर इनपुट टेक्स्ट को स्ट्रक्च करने की प्रक्रिया शामिल होती है, जो स्ट्रैटेजिक डेटा के भीतर पैटर्न का इस्तेमाल करते हैं, जैसे कि स्टैटिस्टिकल पैटर्न लर्निंग, और आखिरकार आउटपुट का मूल्यांकन और व्याख्या।

डेटा विश्लेषण प्रक्रिया

डेटा विश्लेषण को 1961 में सांख्यिकीविद् जॉन टुके द्वारा "डेटा का विश्लेषण करने की प्रक्रिया, ऐसी प्रक्रियाओं के परिणामों की व्याख्या करने की प्रक्रिया, अपने विश्लेषण को आसान, अधिक सटीक या अधिक सटीक बनाने के लिए डेटा एकत्र करने की योजना के तरीके और सभी मशीनरी द्वारा परिभाषित किया गया है।" और (गणितीय) आँकड़ों के परिणाम जो डेटा के विश्लेषण पर लागू होते हैं। "

इस प्रकार, डेटा विश्लेषण विभिन्न स्रोतों से बड़े, असंरचित डेटा प्राप्त करने और इसे उन सूचनाओं में परिवर्तित करने के लिए एक प्रक्रिया है जो इसके लिए उपयोगी है -

  • सवालों का जवाब दे
  • परिकल्पना का परीक्षण करें
  • Decision-making
  • सिद्धांतों को खारिज करना

एक्सेल के साथ डेटा विश्लेषण

Microsoft Excel डेटा का विश्लेषण और व्याख्या करने के कई साधन और तरीके प्रदान करता है। डेटा विभिन्न स्रोतों से हो सकता है। डेटा को कई तरीकों से परिवर्तित और स्वरूपित किया जा सकता है। यह संबंधित एक्सेल कमांड, फ़ंक्शन और टूल के साथ विश्लेषण किया जा सकता है - जिसमें कंडिशनल फॉर्मेटिंग, रेंज, टेबल्स, टेक्स्ट फ़ंक्शन, दिनांक फ़ंक्शंस, टाइम फ़ंक्शंस, वित्तीय फ़ंक्शंस, सबटोटल्स, क्विक एनालिसिस, फॉर्मूला ऑडिटिंग, इनक्वायरी टूल, व्हाट-इफ़ेक्ट एनालिसिस शामिल हैं। सॉल्वर, डेटा मॉडल, पॉवरपिव, पॉवरव्यू, पॉवरपाइप इत्यादि।

आप एक्सेल के साथ इन डेटा विश्लेषण तकनीकों को दो भागों के हिस्से के रूप में सीख रहे होंगे -

  • एक्सेल और के साथ डेटा विश्लेषण
  • Excel के साथ उन्नत डेटा विश्लेषण