आर - बॉक्सप्लॉट्स
Boxplots एक माप है कि डेटा सेट में डेटा कितनी अच्छी तरह से वितरित किया जाता है। यह डेटा को तीन चतुर्थक में विभाजित करता है। यह ग्राफ डेटा सेट में न्यूनतम, अधिकतम, औसत, पहली चतुर्थक और तीसरी चतुर्थक का प्रतिनिधित्व करता है। यह उनमें से प्रत्येक के लिए बॉक्सप्लॉट खींचकर डेटा सेट में डेटा के वितरण की तुलना करने में भी उपयोगी है।
का उपयोग करके R में Boxplots बनाए जाते हैं boxplot() समारोह।
वाक्य - विन्यास
R में एक बॉक्सप्लॉट बनाने के लिए मूल सिंटैक्स है -
boxplot(x, data, notch, varwidth, names, main)
निम्नलिखित मापदंडों का वर्णन है -
x एक सदिश या एक सूत्र है।
data डेटा फ्रेम है।
notchएक तार्किक मूल्य है। पायदान खींचने के लिए TRUE के रूप में सेट करें।
varwidthएक तार्किक मूल्य है। नमूने के आकार के अनुपात में बॉक्स की चौड़ाई खींचने के लिए सही के रूप में सेट करें।
names समूह लेबल हैं जो प्रत्येक बॉक्सप्लॉट के तहत मुद्रित किए जाएंगे।
main का उपयोग ग्राफ को शीर्षक देने के लिए किया जाता है।
उदाहरण
हम मूल बॉक्सप्लॉट बनाने के लिए R वातावरण में उपलब्ध डेटा सेट "mtcars" का उपयोग करते हैं। आइए mtcars में "mpg" और "सिलेंडर" कॉलम देखें।
input <- mtcars[,c('mpg','cyl')]
print(head(input))
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
mpg cyl
Mazda RX4 21.0 6
Mazda RX4 Wag 21.0 6
Datsun 710 22.8 4
Hornet 4 Drive 21.4 6
Hornet Sportabout 18.7 8
Valiant 18.1 6
बॉक्सप्लॉट बनाना
नीचे स्क्रिप्ट mpg (मील प्रति गैलन) और सिलेंडर (सिलेंडरों की संख्या) के बीच संबंध के लिए एक बॉक्सप्लॉट ग्राफ बनाएगी।
# Give the chart file a name.
png(file = "boxplot.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders",
ylab = "Miles Per Gallon", main = "Mileage Data")
# Save the file.
dev.off()
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -
Notch के साथ Boxplot
हम अलग-अलग डेटा समूहों के मध्यस्थों को एक-दूसरे के साथ कैसे मेल खाते हैं, यह जानने के लिए हम notch के साथ बॉक्सप्लेट आकर्षित कर सकते हैं।
नीचे दी गई स्क्रिप्ट प्रत्येक डेटा समूह के लिए notch के साथ एक बॉक्सप्लॉट ग्राफ बनाएगी।
# Give the chart file a name.
png(file = "boxplot_with_notch.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars,
xlab = "Number of Cylinders",
ylab = "Miles Per Gallon",
main = "Mileage Data",
notch = TRUE,
varwidth = TRUE,
col = c("green","yellow","purple"),
names = c("High","Medium","Low")
)
# Save the file.
dev.off()
जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -