ggplot2 - परिचय

ggplot2 एक R पैकेज है जो विशेष रूप से डेटा विज़ुअलाइज़ेशन और सर्वश्रेष्ठ खोजपूर्ण डेटा विश्लेषण प्रदान करने के लिए डिज़ाइन किया गया है। यह सुंदर, परेशानी मुक्त भूखंड प्रदान करता है जो किंवदंतियों को चित्रित करने और उनका प्रतिनिधित्व करने जैसे मिनट विवरणों का ध्यान रखता है। भूखंडों को पुनरावृति से बनाया जा सकता है और बाद में संपादित किया जा सकता है। यह पैकेज एक स्तरित फैशन में काम करने के लिए डिज़ाइन किया गया है, आर के साथ खोजपूर्ण डेटा विश्लेषण के दौरान एकत्र किए गए कच्चे डेटा को दिखाने वाली एक परत के साथ शुरू होता है, फिर एनोटेशन और सांख्यिकीय सारांश की परतों को जोड़ता है।

यहां तक ​​कि सबसे अनुभवी आर उपयोगकर्ताओं को सुरुचिपूर्ण ग्राफिक्स बनाने के लिए मदद की आवश्यकता है। यह पुस्तकालय आर में ग्राफिक्स बनाने के लिए एक अभूतपूर्व उपकरण है, लेकिन लगभग दैनिक उपयोग के कई वर्षों के बाद भी हमें अपनी चीट शीट को संदर्भित करने की आवश्यकता है।

यह पैकेज गहरे व्याकरण के तहत काम करता है जिसे "ग्राफिक्स का व्याकरण" कहा जाता है जो कि स्वतंत्र घटकों के एक सेट से बना होता है जिसे कई तरीकों से बनाया जा सकता है। "ग्राफिक्स का व्याकरण" एकमात्र एकमात्र कारण है जो ggplot2 को बहुत शक्तिशाली बनाता है क्योंकि R डेवलपर पूर्व-निर्दिष्ट ग्राफिक्स के सेट तक सीमित नहीं है जो अन्य पैकेज में उपयोग किया जाता है। व्याकरण में मुख्य नियमों और सिद्धांतों का सरल सेट शामिल है।

वर्ष 2005 में, विल्किंसन ने उन गहन विशेषताओं का वर्णन करने के लिए ग्राफिक्स के व्याकरण की अवधारणा बनाई या बल्कि उत्पन्न की, जो सभी सांख्यिकीय ग्राफिक्स के बीच शामिल है। यह परतों के प्राथमिक पर केंद्रित है जिसमें आर के साथ एम्बेडेड विशेषताओं को शामिल करना शामिल है।

"ग्राफिक्स के व्याकरण" और आर के बीच संबंध

यह उपयोगकर्ता या डेवलपर को बताता है कि डेटा को सौंदर्य विशेषताओं, जैसे रंग, आकृति, आकार के आकार, संबंधित ज्यामितीय वस्तुओं जैसे बिंदुओं, रेखाओं और बार के लिए मैप करने के लिए एक सांख्यिकीय ग्राफ़िक का उपयोग किया जाता है। प्लॉट में संबंधित डेटा के विभिन्न सांख्यिकीय रूपांतरण भी हो सकते हैं जो उल्लेखित समन्वय प्रणाली पर तैयार किए गए हैं। इसमें "फेसिंग" नाम की एक सुविधा भी शामिल है, जिसका उपयोग आम तौर पर उल्लेखित डेटासेट के विभिन्न सबसेट के लिए एक ही प्लॉट बनाने के लिए किया जाता है। आर में विभिन्न अंतर्निर्मित डेटासेट शामिल हैं। इन स्वतंत्र घटकों के संयोजन में पूरी तरह से एक विशेष ग्राफिक शामिल है।

अब हम विभिन्न प्रकार के भूखंडों पर ध्यान केंद्रित करते हैं जिन्हें व्याकरण के संदर्भ में बनाया जा सकता है -

डेटा

यदि उपयोगकर्ता सौंदर्य मैपिंग के दिए गए सेट की कल्पना करना चाहता है, जो बताता है कि मैप किए गए सौंदर्य विशेषताओं के निर्माण के लिए डेटा में आवश्यक चर एक साथ मैप किए गए हैं।

परतों

यह ज्यामितीय तत्वों और आवश्यक सांख्यिकीय परिवर्तन से बना है। लेयर्स में जियोमेट्रिक ऑब्जेक्ट्स, शॉर्ट डेटा के लिए जूम शामिल होते हैं जो वास्तव में बिंदुओं, रेखाओं, बहुभुजों और कई और अधिक की मदद से प्लॉट का प्रतिनिधित्व करते हैं। सबसे अच्छा प्रदर्शन एक विशिष्ट रेखीय मॉडल के 2 डी रिश्ते को सारांशित करने के लिए विशिष्ट हिस्टोग्राम बनाने के लिए टिप्पणियों को गिनना और गिनना है।

तराजू

स्केल का उपयोग डेटा स्पेस में मानों को मैप करने के लिए किया जाता है जो मूल्यों के निर्माण के लिए उपयोग किया जाता है चाहे वह रंग, आकार और आकार हो। यह एक किंवदंती या कुल्हाड़ियों को आकर्षित करने में मदद करता है, जो उल्लिखित भूखंड से मूल डेटा मूल्यों को पढ़ने के लिए एक उलटा मानचित्रण प्रदान करने के लिए आवश्यक है।

समन्वय प्रणाली

यह बताता है कि ग्राफिक के उल्लिखित विमान में डेटा निर्देशांक को एक साथ मैप कैसे किया जाता है। यह उन कुल्हाड़ियों और ग्रिडलाइन्स की जानकारी भी प्रदान करता है जिनकी आवश्यकता ग्राफ को पढ़ने के लिए होती है। आम तौर पर इसका उपयोग कार्टेशियन समन्वय प्रणाली के रूप में किया जाता है जिसमें ध्रुवीय निर्देशांक और मानचित्र अनुमान शामिल होते हैं।

faceting

इसमें यह आवश्यक है कि डेटा को आवश्यक सबसेट में कैसे विभाजित किया जाए और सबसेट को डेटा के गुणक के रूप में प्रदर्शित किया जाए। इसे कंडीशनिंग या लैटिसिंग प्रक्रिया भी कहा जाता है।

विषय

यह फॉन्ट साइज और बैकग्राउंड कलर प्रॉपर्टीज जैसे डिस्प्ले के महीन बिंदुओं को नियंत्रित करता है। एक आकर्षक भूखंड बनाने के लिए, संदर्भों पर विचार करना हमेशा बेहतर होता है।

अब, उन सीमाओं या विशेषताओं पर चर्चा करना भी उतना ही महत्वपूर्ण है जो व्याकरण प्रदान नहीं करता है -

  • इसमें सुझाव का अभाव है कि किस ग्राफिक्स का उपयोग किया जाना चाहिए या एक उपयोगकर्ता को ऐसा करने में रुचि है।

  • यह अन्तरक्रियाशीलता का वर्णन नहीं करता है क्योंकि इसमें केवल स्थैतिक ग्राफिक्स का वर्णन शामिल है। गतिशील ग्राफिक्स के निर्माण के लिए अन्य वैकल्पिक समाधान लागू किया जाना चाहिए।

Ggplot2 के साथ बनाया गया सरल ग्राफ नीचे उल्लिखित है -