R - Grafici a dispersione
I grafici a dispersione mostrano molti punti tracciati nel piano cartesiano. Ogni punto rappresenta i valori di due variabili. Una variabile viene scelta sull'asse orizzontale e un'altra sull'asse verticale.
Il semplice grafico a dispersione viene creato utilizzando il plot() funzione.
Sintassi
La sintassi di base per creare un grafico a dispersione in R è:
plot(x, y, main, xlab, ylab, xlim, ylim, axes)
Di seguito la descrizione dei parametri utilizzati:
x è il set di dati i cui valori sono le coordinate orizzontali.
y è il set di dati i cui valori sono le coordinate verticali.
main è la tessera del grafico.
xlab è l'etichetta sull'asse orizzontale.
ylab è l'etichetta sull'asse verticale.
xlim sono i limiti dei valori di x utilizzati per la stampa.
ylim sono i limiti dei valori di y utilizzati per la stampa.
axes indica se entrambi gli assi devono essere disegnati sul grafico.
Esempio
Usiamo il set di dati "mtcars"disponibile nell'ambiente R per creare un grafico a dispersione di base. Usiamo le colonne "wt" e "mpg" in mtcars.
input <- mtcars[,c('wt','mpg')]
print(head(input))
Quando eseguiamo il codice sopra, produce il seguente risultato:
wt mpg
Mazda RX4 2.620 21.0
Mazda RX4 Wag 2.875 21.0
Datsun 710 2.320 22.8
Hornet 4 Drive 3.215 21.4
Hornet Sportabout 3.440 18.7
Valiant 3.460 18.1
Creazione del grafico a dispersione
Lo script seguente creerà un grafico a dispersione per la relazione tra wt (peso) e mpg (miglia per gallone).
# Get the input values.
input <- mtcars[,c('wt','mpg')]
# Give the chart file a name.
png(file = "scatterplot.png")
# Plot the chart for cars with weight between 2.5 to 5 and mileage between 15 and 30.
plot(x = input$wt,y = input$mpg,
xlab = "Weight",
ylab = "Milage",
xlim = c(2.5,5),
ylim = c(15,30),
main = "Weight vs Milage"
)
# Save the file.
dev.off()
Quando eseguiamo il codice sopra, produce il seguente risultato:
Matrici del grafico a dispersione
Quando abbiamo più di due variabili e vogliamo trovare la correlazione tra una variabile rispetto alle rimanenti utilizziamo la matrice del grafico a dispersione. Noi usiamopairs() funzione per creare matrici di grafici a dispersione.
Sintassi
La sintassi di base per creare matrici di grafici a dispersione in R è:
pairs(formula, data)
Di seguito la descrizione dei parametri utilizzati:
formula rappresenta la serie di variabili usate a coppie.
data rappresenta il set di dati da cui verranno prese le variabili.
Esempio
Ogni variabile è accoppiata a ciascuna delle rimanenti variabili. Viene tracciato un grafico a dispersione per ciascuna coppia.
# Give the chart file a name.
png(file = "scatterplot_matrices.png")
# Plot the matrices between 4 variables giving 12 plots.
# One variable with 3 others and total 4 variables.
pairs(~wt+mpg+disp+cyl,data = mtcars,
main = "Scatterplot Matrix")
# Save the file.
dev.off()
Quando il codice precedente viene eseguito, otteniamo il seguente output.