R - Dağılım grafikleri

Dağılım grafikleri, Kartezyen düzlemde çizilen birçok noktayı gösterir. Her nokta, iki değişkenin değerlerini temsil eder. Bir değişken yatay eksende ve diğeri dikey eksende seçilir.

Basit dağılım grafiği, plot() işlevi.

Sözdizimi

R'de dağılım grafiği oluşturmak için temel sözdizimi -

plot(x, y, main, xlab, ylab, xlim, ylim, axes)

Kullanılan parametrelerin açıklaması aşağıdadır -

  • x değerleri yatay koordinatlar olan veri kümesidir.

  • y değerleri dikey koordinatlar olan veri kümesidir.

  • main grafiğin döşemesidir.

  • xlab yatay eksendeki etikettir.

  • ylab dikey eksendeki etikettir.

  • xlim çizim için kullanılan x değerlerinin sınırlarıdır.

  • ylim çizim için kullanılan y değerlerinin sınırlarıdır.

  • axes her iki eksenin de çizim üzerinde çizilip çizilmeyeceğini gösterir.

Misal

Veri setini kullanıyoruz "mtcars"R ortamında temel bir dağılım grafiği oluşturmak için kullanılabilir. Mtcarlarda "wt" ve "mpg" sütunlarını kullanalım.

input <- mtcars[,c('wt','mpg')]
print(head(input))

Yukarıdaki kodu çalıştırdığımızda şu sonucu verir -

wt      mpg
Mazda RX4           2.620   21.0
Mazda RX4 Wag       2.875   21.0
Datsun 710          2.320   22.8
Hornet 4 Drive      3.215   21.4
Hornet Sportabout   3.440   18.7
Valiant             3.460   18.1

Dağılım Grafiği Oluşturma

Aşağıdaki komut dosyası, wt (ağırlık) ve mpg (galon başına mil) arasındaki ilişki için bir dağılım grafiği grafiği oluşturacaktır.

# Get the input values.
input <- mtcars[,c('wt','mpg')]

# Give the chart file a name.
png(file = "scatterplot.png")

# Plot the chart for cars with weight between 2.5 to 5 and mileage between 15 and 30.
plot(x = input$wt,y = input$mpg,
   xlab = "Weight",
   ylab = "Milage",
   xlim = c(2.5,5),
   ylim = c(15,30),		 
   main = "Weight vs Milage"
)
	 
# Save the file.
dev.off()

Yukarıdaki kodu çalıştırdığımızda şu sonucu verir -

Dağılım grafiği Matrisleri

İkiden fazla değişkenimiz olduğunda ve bir değişkenle diğer değişkenler arasındaki korelasyonu bulmak istediğimizde dağılım grafiği matrisini kullanırız. Kullanırızpairs() dağılım grafiklerinin matrislerini oluşturma işlevi.

Sözdizimi

R'de dağılım grafiği matrisleri oluşturmak için temel sözdizimi -

pairs(formula, data)

Kullanılan parametrelerin açıklaması aşağıdadır -

  • formula çiftler halinde kullanılan değişken serisini temsil eder.

  • data değişkenlerin alınacağı veri setini temsil eder.

Misal

Her değişken, kalan değişkenlerin her biri ile eşleştirilir. Her çift için bir dağılım grafiği çizilir.

# Give the chart file a name.
png(file = "scatterplot_matrices.png")

# Plot the matrices between 4 variables giving 12 plots.

# One variable with 3 others and total 4 variables.

pairs(~wt+mpg+disp+cyl,data = mtcars,
   main = "Scatterplot Matrix")

# Save the file.
dev.off()

Yukarıdaki kod çalıştırıldığında aşağıdaki çıktıyı alırız.