R - Grafici a dispersione

I grafici a dispersione mostrano molti punti tracciati nel piano cartesiano. Ogni punto rappresenta i valori di due variabili. Una variabile viene scelta sull'asse orizzontale e un'altra sull'asse verticale.

Il semplice grafico a dispersione viene creato utilizzando il plot() funzione.

Sintassi

La sintassi di base per creare un grafico a dispersione in R è:

plot(x, y, main, xlab, ylab, xlim, ylim, axes)

Di seguito la descrizione dei parametri utilizzati:

  • x è il set di dati i cui valori sono le coordinate orizzontali.

  • y è il set di dati i cui valori sono le coordinate verticali.

  • main è la tessera del grafico.

  • xlab è l'etichetta sull'asse orizzontale.

  • ylab è l'etichetta sull'asse verticale.

  • xlim sono i limiti dei valori di x utilizzati per la stampa.

  • ylim sono i limiti dei valori di y utilizzati per la stampa.

  • axes indica se entrambi gli assi devono essere disegnati sul grafico.

Esempio

Usiamo il set di dati "mtcars"disponibile nell'ambiente R per creare un grafico a dispersione di base. Usiamo le colonne "wt" e "mpg" in mtcars.

input <- mtcars[,c('wt','mpg')]
print(head(input))

Quando eseguiamo il codice sopra, produce il seguente risultato:

wt      mpg
Mazda RX4           2.620   21.0
Mazda RX4 Wag       2.875   21.0
Datsun 710          2.320   22.8
Hornet 4 Drive      3.215   21.4
Hornet Sportabout   3.440   18.7
Valiant             3.460   18.1

Creazione del grafico a dispersione

Lo script seguente creerà un grafico a dispersione per la relazione tra wt (peso) e mpg (miglia per gallone).

# Get the input values.
input <- mtcars[,c('wt','mpg')]

# Give the chart file a name.
png(file = "scatterplot.png")

# Plot the chart for cars with weight between 2.5 to 5 and mileage between 15 and 30.
plot(x = input$wt,y = input$mpg,
   xlab = "Weight",
   ylab = "Milage",
   xlim = c(2.5,5),
   ylim = c(15,30),		 
   main = "Weight vs Milage"
)
	 
# Save the file.
dev.off()

Quando eseguiamo il codice sopra, produce il seguente risultato:

Matrici del grafico a dispersione

Quando abbiamo più di due variabili e vogliamo trovare la correlazione tra una variabile rispetto alle rimanenti utilizziamo la matrice del grafico a dispersione. Noi usiamopairs() funzione per creare matrici di grafici a dispersione.

Sintassi

La sintassi di base per creare matrici di grafici a dispersione in R è:

pairs(formula, data)

Di seguito la descrizione dei parametri utilizzati:

  • formula rappresenta la serie di variabili usate a coppie.

  • data rappresenta il set di dati da cui verranno prese le variabili.

Esempio

Ogni variabile è accoppiata a ciascuna delle rimanenti variabili. Viene tracciato un grafico a dispersione per ciascuna coppia.

# Give the chart file a name.
png(file = "scatterplot_matrices.png")

# Plot the matrices between 4 variables giving 12 plots.

# One variable with 3 others and total 4 variables.

pairs(~wt+mpg+disp+cyl,data = mtcars,
   main = "Scatterplot Matrix")

# Save the file.
dev.off()

Quando il codice precedente viene eseguito, otteniamo il seguente output.