R - Boxplots
I boxplot sono una misura di quanto ben distribuiti sono i dati in un set di dati. Divide il set di dati in tre quartili. Questo grafico rappresenta il minimo, il massimo, la mediana, il primo quartile e il terzo quartile nel set di dati. È anche utile per confrontare la distribuzione dei dati tra i set di dati disegnando boxplot per ciascuno di essi.
I grafici a scatole vengono creati in R utilizzando il boxplot() funzione.
Sintassi
La sintassi di base per creare un boxplot in R è:
boxplot(x, data, notch, varwidth, names, main)
Di seguito la descrizione dei parametri utilizzati:
x è un vettore o una formula.
data è il data frame.
notchè un valore logico. Imposta come TRUE per disegnare una tacca.
varwidthè un valore logico. Imposta come true per disegnare la larghezza della casella proporzionata alla dimensione del campione.
names sono le etichette di gruppo che verranno stampate sotto ogni boxplot.
main è usato per dare un titolo al grafico.
Esempio
Usiamo il set di dati "mtcars" disponibile nell'ambiente R per creare un boxplot di base. Diamo un'occhiata alle colonne "mpg" e "cil" in mtcars.
input <- mtcars[,c('mpg','cyl')]
print(head(input))
Quando eseguiamo il codice sopra, produce il seguente risultato:
mpg cyl
Mazda RX4 21.0 6
Mazda RX4 Wag 21.0 6
Datsun 710 22.8 4
Hornet 4 Drive 21.4 6
Hornet Sportabout 18.7 8
Valiant 18.1 6
Creazione del boxplot
Lo script seguente creerà un grafico a scatole per la relazione tra mpg (miglia per gallone) e cil (numero di cilindri).
# Give the chart file a name.
png(file = "boxplot.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "Number of Cylinders",
ylab = "Miles Per Gallon", main = "Mileage Data")
# Save the file.
dev.off()
Quando eseguiamo il codice sopra, produce il seguente risultato:
Boxplot con Notch
Possiamo disegnare un boxplot con notch per scoprire come le mediane di diversi gruppi di dati corrispondono tra loro.
Lo script seguente creerà un grafico a boxplot con tacca per ciascuno dei gruppi di dati.
# Give the chart file a name.
png(file = "boxplot_with_notch.png")
# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars,
xlab = "Number of Cylinders",
ylab = "Miles Per Gallon",
main = "Mileage Data",
notch = TRUE,
varwidth = TRUE,
col = c("green","yellow","purple"),
names = c("High","Medium","Low")
)
# Save the file.
dev.off()
Quando eseguiamo il codice sopra, produce il seguente risultato: