R - Wykresy rozrzutu

Wykresy rozrzutu pokazują wiele punktów wykreślonych na płaszczyźnie kartezjańskiej. Każdy punkt reprezentuje wartości dwóch zmiennych. Jedna zmienna jest wybierana na osi poziomej, a druga na osi pionowej.

Prosty wykres rozrzutu jest tworzony przy użyciu rozszerzenia plot() funkcjonować.

Składnia

Podstawowa składnia tworzenia wykresu rozrzutu w R to -

plot(x, y, main, xlab, ylab, xlim, ylim, axes)

Poniżej znajduje się opis użytych parametrów -

  • x to zbiór danych, którego wartości są współrzędnymi poziomymi.

  • y to zbiór danych, którego wartości są współrzędnymi pionowymi.

  • main to kafelek wykresu.

  • xlab to etykieta na osi poziomej.

  • ylab to etykieta na osi pionowej.

  • xlim to granice wartości x używanych do kreślenia.

  • ylim to granice wartości y użytych do wykreślenia.

  • axes wskazuje, czy na wykresie powinny być narysowane obie osie.

Przykład

Korzystamy ze zbioru danych "mtcars"dostępne w środowisku R, aby utworzyć podstawowy wykres rozrzutu. Użyjmy kolumn „wt” i „mpg” w mtcars.

input <- mtcars[,c('wt','mpg')]
print(head(input))

Kiedy wykonujemy powyższy kod, daje on następujący wynik -

wt      mpg
Mazda RX4           2.620   21.0
Mazda RX4 Wag       2.875   21.0
Datsun 710          2.320   22.8
Hornet 4 Drive      3.215   21.4
Hornet Sportabout   3.440   18.7
Valiant             3.460   18.1

Tworzenie wykresu rozrzutu

Poniższy skrypt utworzy wykres rozrzutu dla zależności między wagą (wagą) a mpg (milami na galon).

# Get the input values.
input <- mtcars[,c('wt','mpg')]

# Give the chart file a name.
png(file = "scatterplot.png")

# Plot the chart for cars with weight between 2.5 to 5 and mileage between 15 and 30.
plot(x = input$wt,y = input$mpg,
   xlab = "Weight",
   ylab = "Milage",
   xlim = c(2.5,5),
   ylim = c(15,30),		 
   main = "Weight vs Milage"
)
	 
# Save the file.
dev.off()

Kiedy wykonujemy powyższy kod, daje on następujący wynik -

Macierze wykresu rozrzutu

Gdy mamy więcej niż dwie zmienne i chcemy znaleźć korelację między jedną zmienną a pozostałymi, używamy macierzy wykresu rozrzutu. Używamypairs() funkcja tworzenia macierzy wykresów rozrzutu.

Składnia

Podstawowa składnia tworzenia macierzy wykresu rozrzutu w R to -

pairs(formula, data)

Poniżej znajduje się opis użytych parametrów -

  • formula reprezentuje szereg zmiennych używanych w parach.

  • data reprezentuje zbiór danych, z którego będą pobierane zmienne.

Przykład

Każda zmienna jest powiązana z każdą z pozostałych zmiennych. Dla każdej pary wykreślany jest wykres rozrzutu.

# Give the chart file a name.
png(file = "scatterplot_matrices.png")

# Plot the matrices between 4 variables giving 12 plots.

# One variable with 3 others and total 4 variables.

pairs(~wt+mpg+disp+cyl,data = mtcars,
   main = "Scatterplot Matrix")

# Save the file.
dev.off()

Po wykonaniu powyższego kodu otrzymujemy następujące dane wyjściowe.