ggplot2 - एकाधिक भूखंड

इस अध्याय में, हम कई भूखंडों के निर्माण पर ध्यान केंद्रित करेंगे जिनका उपयोग आगे 3 आयामी भूखंड बनाने के लिए किया जा सकता है। जिन भूखंडों की सूची शामिल की जाएगी उनमें शामिल हैं -

  • घनत्व प्लॉट
  • बॉक्स प्लॉट
  • बिंदु साजिश
  • वायलिन प्लॉट

हम पिछले अध्याय में उपयोग किए गए "mpg" डेटासेट का उपयोग करेंगे। यह डेटासेट 38 लोकप्रिय कारों के लिए 1999 और 2008 से ईंधन अर्थव्यवस्था डेटा प्रदान करता है। डेटासेट ggplot2 पैकेज के साथ भेज दिया गया है। विभिन्न प्रकार के भूखंडों को बनाने के लिए नीचे दिए गए कदम का पालन करना महत्वपूर्ण है।

> # Load Modules
> library(ggplot2)
>
> # Dataset
> head(mpg)
# A tibble: 6 x 11
manufacturer  model   displ   year   cyl   trans       drv   cty   hwy  fl   class
<chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int> <chr> <chr>
1 audi        a4      1.8     1999   4     auto(l5)    f     18    29   p    compa~
2 audi        a4      1.8     1999   4     manual(m5)  f     21    29   p    compa~
3 audi        a4      2       2008   4     manual(m6)  f     20    31   p    compa~
4 audi        a4      2       2008   4     auto(av)    f     21    30   p    compa~
5 audi        a4      2.8     1999   6     auto(l5)    f     16    26   p    compa~
6 audi        a4      2.8     1999   6     manual(m5)  f     18    26   p    compa~

घनत्व प्लॉट

एक घनत्व प्लॉट उल्लेखित डेटासेट में किसी भी संख्यात्मक चर के वितरण का एक ग्राफिक प्रतिनिधित्व है। यह चर की संभावना घनत्व फ़ंक्शन को दिखाने के लिए कर्नेल घनत्व अनुमान का उपयोग करता है।

"Ggplot2" पैकेज में घनत्व प्लॉट बनाने के लिए geom_density () नामक फ़ंक्शन शामिल है।

घनत्व प्लॉट बनाने के लिए हम निम्नलिखित कमांड निष्पादित करेंगे -

> p −- ggplot(mpg, aes(cty)) +
+  geom_density(aes(fill=factor(cyl)), alpha=0.8)
> p

हम नीचे निर्मित प्लॉट से विभिन्न घनत्वों का निरीक्षण कर सकते हैं -

हम x और y कुल्हाड़ियों का नाम बदलकर साजिश रच सकते हैं जो विभिन्न रंगों के संयोजन के साथ शीर्षक और किंवदंतियों को शामिल करने के साथ बेहतर स्पष्टता बनाए रखता है।

> p + labs(title="Density plot",
+    subtitle="City Mileage Grouped by Number of cylinders",
+    caption="Source: mpg",
+    x="City Mileage",
+    fill="# Cylinders")

बॉक्स प्लॉट

बॉक्स प्लॉट जिसे बॉक्स भी कहा जाता है और व्हिस्कर प्लॉट डेटा के पांच-नंबर सारांश का प्रतिनिधित्व करता है। पांच नंबर सारांश में न्यूनतम, प्रथम चतुर्थक, मध्य, तृतीय चतुर्थक और अधिकतम जैसे मान शामिल हैं। बॉक्स प्लॉट के मध्य भाग से होकर जाने वाली ऊर्ध्वाधर रेखा को "माध्यिका" माना जाता है।

हम निम्नलिखित कमांड का उपयोग करके बॉक्स प्लॉट बना सकते हैं -

> p <- ggplot(mpg, aes(class, cty)) +
+  geom_boxplot(varwidth=T, fill="blue")
> p + labs(title="A Box plot Example",
+    subtitle="Mileage by Class",
+    caption="MPG Dataset",
+    x="Class",
+    y="Mileage")
>p

यहां, हम वर्ग और cty की विशेषताओं के संबंध में बॉक्स प्लॉट बना रहे हैं।

बिंदु साजिश

डॉट प्लॉट बिखरे हुए प्लॉट के समान होते हैं जिनमें केवल आयाम के अंतर होते हैं। इस खंड में, हम मौजूदा बॉक्स प्लॉट में बेहतर चित्र और स्पष्टता के लिए डॉट प्लॉट जोड़ रहे हैं।

निम्नलिखित आदेश का उपयोग करके बॉक्स प्लॉट बनाया जा सकता है -

> p <- ggplot(mpg, aes(manufacturer, cty)) +
+    geom_boxplot() +
+    theme(axis.text.x = element_text(angle=65, vjust=0.6))
> p

डॉट प्लॉट का निर्माण निम्नानुसार किया गया है -

> p + geom_dotplot(binaxis='y',
+    stackdir='center',
+    dotsize = .5
+    )

वायलिन प्लॉट

वायलिन की साजिश भी इसी तरह से बनाई गई है जिसमें बॉक्स के बजाय केवल वायलिन के संरचना परिवर्तन हैं। उत्पादन नीचे स्पष्ट रूप से उल्लेख किया गया है -

> p <- ggplot(mpg, aes(class, cty))
>
> p + geom_violin()