ggplot2 - स्कैटर प्लॉट और जिटर प्लॉट

स्कैटर प्लॉट लाइन ग्राफ के समान हैं जो आमतौर पर प्लॉटिंग के लिए उपयोग किए जाते हैं। तितर बितर भूखंड दिखाते हैं कि एक चर दूसरे से कितना संबंधित है। चर के बीच के संबंध को सहसंबंध कहा जाता है जो आमतौर पर सांख्यिकीय विधियों में उपयोग किया जाता है। हम "आईरिस" नामक समान डेटासेट का उपयोग करेंगे जिसमें प्रत्येक चर के बीच बहुत अधिक भिन्नता शामिल है। यह प्रसिद्ध डेटासेट है जो आइरिस की 3 प्रजातियों में से प्रत्येक से 50 फूलों के लिए पत्थरों की लंबाई और चौड़ाई के साथ चर लंबाई और चौड़ाई के सेंटीमीटर में माप देता है। प्रजातियों को आइरिस सेटोसा, वर्सीकोलर और वर्जिनिका कहा जाता है।

बेसिक स्कैटर प्लॉट बनाना

"Ggplot2" पैकेज के साथ तितर बितर भूखंड बनाने के लिए निम्नलिखित कदम शामिल हैं -

निम्नलिखित के लिए एक मूल स्कैटर प्लॉट बनाने के लिए कमांड निष्पादित की जाती है -

> # Basic Scatter Plot
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+    geom_point()

विशेषताएँ जोड़ना

हम geom_point () फ़ंक्शन में आकृति नामक संपत्ति के साथ अंकों के आकार को बदल सकते हैं।

> # Change the shape of points
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+    geom_point(shape=1)

हम उन बिंदुओं में रंग जोड़ सकते हैं जो आवश्यक तितर बितर भूखंडों में जोड़े जाते हैं।

> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1)

इस उदाहरण में, हमने उन प्रजातियों के अनुसार रंग बनाए हैं जिनका उल्लेख किंवदंतियों में किया गया है। उल्लिखित भूखंड में तीनों प्रजातियां विशिष्ट रूप से प्रतिष्ठित हैं।

अब हम चर के बीच संबंध स्थापित करने पर ध्यान केंद्रित करेंगे।

> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm)

geom_smooth कार्य अतिव्यापी और आवश्यक चर के पैटर्न बनाने के पैटर्न एड्स।

विशेषता विधि "lm" में प्रतिगमन रेखा का उल्लेख है जिसे विकसित करने की आवश्यकता है।

> # Add a regression line
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm)

हम नीचे उल्लेख वाक्यविन्यास के साथ बिना छायांकित आत्मविश्वास वाले क्षेत्र के साथ एक प्रतिगमन रेखा भी जोड़ सकते हैं -

># Add a regression line but no shaded confidence region
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+    geom_point(shape=1) +
+    geom_smooth(method=lm, se=FALSE)

छायांकित क्षेत्र विश्वास क्षेत्रों के अलावा अन्य चीजों का प्रतिनिधित्व करते हैं।

जटर प्लॉट

घबराने वाले भूखंडों में विशेष प्रभाव शामिल होते हैं जिनके साथ बिखरे हुए भूखंडों को चित्रित किया जा सकता है। घबराना कुछ भी नहीं है, लेकिन एक यादृच्छिक मूल्य है जो डॉट्स को सौंपा गया है उन्हें नीचे बताए अनुसार अलग किया जाए -

> ggplot(mpg, aes(cyl, hwy)) +
+    geom_point() +
+    geom_jitter(aes(colour = class))