अजगर - पंडों

पंडस एक ओपन-सोर्स पायथन लाइब्रेरी है जिसका उपयोग उच्च प्रदर्शन डेटा हेरफेर और डेटा विश्लेषण के लिए अपने शक्तिशाली डेटा संरचनाओं का उपयोग करने के लिए किया जाता है। पांडा के साथ अजगर वित्त, अर्थशास्त्र, सांख्यिकी, विज्ञापन, वेब विश्लेषिकी, और अधिक सहित कई शैक्षणिक और वाणिज्यिक डोमेन में उपयोग में है। पंडों का उपयोग करते हुए, हम डेटा की उत्पत्ति, डेटा के लोड, व्यवस्थित, हेरफेर, मॉडल की परवाह किए बिना, डेटा के प्रसंस्करण और विश्लेषण में पांच विशिष्ट चरणों को पूरा कर सकते हैं।

नीचे पंडों की कुछ महत्वपूर्ण विशेषताएं बताई गई हैं जो विशेष रूप से डाटा प्रोसेसिंग और डेटा विश्लेषण कार्य के लिए उपयोग की जाती हैं।

पंडों की प्रमुख विशेषताएं

  • डिफ़ॉल्ट और अनुकूलित अनुक्रमण के साथ तेज़ और कुशल DataFrame ऑब्जेक्ट।
  • विभिन्न फ़ाइल स्वरूपों से इन-मेमोरी डेटा ऑब्जेक्ट में डेटा लोड करने के लिए उपकरण।
  • डेटा संरेखण और लापता डेटा की एकीकृत हैंडलिंग।
  • दिनांक सेट करने का पुनरावर्तन और धुरी।
  • लेबल-आधारित स्लाइसिंग, इंडेक्सिंग और बड़े डेटा सेटों का सबसेट।
  • डेटा संरचना से कॉलम हटाए या डाले जा सकते हैं।
  • एकत्रीकरण और परिवर्तनों के लिए डेटा द्वारा समूह।
  • उच्च प्रदर्शन विलय और डेटा में शामिल होना।
  • समय श्रृंखला कार्यक्षमता।

पंडों ने निम्नलिखित तीन डेटा संरचनाओं से संबंधित है -

  • Series
  • DataFrame

ये डेटा संरचनाएं Numpy सरणी के ऊपर बनाई गई हैं, जो उन्हें तेज और कुशल बनाती हैं।

आयाम और विवरण

इन डेटा संरचनाओं के बारे में सोचने का सबसे अच्छा तरीका यह है कि उच्च आयामी डेटा संरचना इसके निचले आयामी डेटा संरचना का एक कंटेनर है। उदाहरण के लिए, DataFrame श्रृंखला का एक कंटेनर है, पैनल DataFrame का एक कंटेनर है।

डेटा संरचना आयाम विवरण
श्रृंखला 1 1D सजातीय सरणी, आकार-अपरिवर्तनीय लेबल।
डेटा फ्रेम्स 2 सामान्य 2 डी लेबल, संभावित विषम स्तंभों के साथ आकार-परस्पर सारणीबद्ध संरचना।

DataFrame का व्यापक रूप से उपयोग किया जाता है और यह सबसे महत्वपूर्ण डेटा स्ट्रक्चर्स है।

श्रृंखला

श्रृंखला एक आयामी सरणी है जैसे सजातीय डेटा के साथ संरचना। उदाहरण के लिए, निम्नलिखित श्रृंखला पूर्णांक 10, 23, 56,… का संग्रह है

10 23 56 17 52 61 73 90 26 72

श्रृंखला के प्रमुख बिंदु

  • सजातीय डेटा
  • आकार अपरिवर्तनीय
  • डेटा म्यूटेबल का मान

डेटा ढांचा

DataFrame विषम डेटा के साथ एक दो आयामी सरणी है। उदाहरण के लिए,

नाम उम्र लिंग रेटिंग
स्टीव 32 पुरुष 3.45
लिया 28 महिला 4.6
विन 45 पुरुष 3.9
केटी 38 महिला 2.78

तालिका एक संगठन की बिक्री टीम के डेटा को उनके समग्र प्रदर्शन रेटिंग के साथ दर्शाती है। डेटा को पंक्तियों और स्तंभों में दर्शाया गया है। प्रत्येक स्तंभ एक विशेषता का प्रतिनिधित्व करता है और प्रत्येक पंक्ति एक व्यक्ति का प्रतिनिधित्व करती है।

कॉलम के डेटा प्रकार

चार कॉलम के डेटा प्रकार इस प्रकार हैं -

स्तंभ प्रकार
नाम तार
उम्र पूर्णांक
लिंग तार
रेटिंग फ्लोट

डाटा फ्रेम के प्रमुख बिंदु

  • विषम डेटा
  • आकार का म्यूटेबल
  • डेटा म्यूटेबल

हम अगले अध्यायों में डेटा विज्ञान कार्य में अजगर के पंडों के पुस्तकालय का उपयोग करने पर बहुत सारे उदाहरण देखेंगे।