R - Gráficos de dispersão

Os gráficos de dispersão mostram muitos pontos plotados no plano cartesiano. Cada ponto representa os valores de duas variáveis. Uma variável é escolhida no eixo horizontal e outra no eixo vertical.

O gráfico de dispersão simples é criado usando o plot() função.

Sintaxe

A sintaxe básica para criar gráfico de dispersão em R é -

plot(x, y, main, xlab, ylab, xlim, ylim, axes)

A seguir está a descrição dos parâmetros usados ​​-

  • x é o conjunto de dados cujos valores são as coordenadas horizontais.

  • y é o conjunto de dados cujos valores são as coordenadas verticais.

  • main é o bloco do gráfico.

  • xlab é o rótulo no eixo horizontal.

  • ylab é o rótulo no eixo vertical.

  • xlim são os limites dos valores de x usados ​​para plotagem.

  • ylim são os limites dos valores de y usados ​​para plotagem.

  • axes indica se ambos os eixos devem ser desenhados no gráfico.

Exemplo

Usamos o conjunto de dados "mtcars"disponível no ambiente R para criar um gráfico de dispersão básico. Vamos usar as colunas "wt" e "mpg" em mtcars.

input <- mtcars[,c('wt','mpg')]
print(head(input))

Quando executamos o código acima, ele produz o seguinte resultado -

wt      mpg
Mazda RX4           2.620   21.0
Mazda RX4 Wag       2.875   21.0
Datsun 710          2.320   22.8
Hornet 4 Drive      3.215   21.4
Hornet Sportabout   3.440   18.7
Valiant             3.460   18.1

Criação do gráfico de dispersão

O script a seguir criará um gráfico de dispersão para a relação entre peso (peso) e mpg (milhas por galão).

# Get the input values.
input <- mtcars[,c('wt','mpg')]

# Give the chart file a name.
png(file = "scatterplot.png")

# Plot the chart for cars with weight between 2.5 to 5 and mileage between 15 and 30.
plot(x = input$wt,y = input$mpg,
   xlab = "Weight",
   ylab = "Milage",
   xlim = c(2.5,5),
   ylim = c(15,30),		 
   main = "Weight vs Milage"
)
	 
# Save the file.
dev.off()

Quando executamos o código acima, ele produz o seguinte resultado -

Matrizes de gráfico de dispersão

Quando temos mais de duas variáveis ​​e queremos encontrar a correlação entre uma variável e as restantes, usamos a matriz de gráfico de dispersão. Nós usamospairs() função para criar matrizes de gráficos de dispersão.

Sintaxe

A sintaxe básica para criar matrizes de gráfico de dispersão em R é -

pairs(formula, data)

A seguir está a descrição dos parâmetros usados ​​-

  • formula representa a série de variáveis ​​usadas em pares.

  • data representa o conjunto de dados do qual as variáveis ​​serão obtidas.

Exemplo

Cada variável está emparelhada com cada uma das variáveis ​​restantes. Um gráfico de dispersão é traçado para cada par.

# Give the chart file a name.
png(file = "scatterplot_matrices.png")

# Plot the matrices between 4 variables giving 12 plots.

# One variable with 3 others and total 4 variables.

pairs(~wt+mpg+disp+cyl,data = mtcars,
   main = "Scatterplot Matrix")

# Save the file.
dev.off()

Quando o código acima é executado, obtemos a seguinte saída.