R - Dağılım grafikleri
Dağılım grafikleri, Kartezyen düzlemde çizilen birçok noktayı gösterir. Her nokta, iki değişkenin değerlerini temsil eder. Bir değişken yatay eksende ve diğeri dikey eksende seçilir.
Basit dağılım grafiği, plot() işlevi.
Sözdizimi
R'de dağılım grafiği oluşturmak için temel sözdizimi -
plot(x, y, main, xlab, ylab, xlim, ylim, axes)
Kullanılan parametrelerin açıklaması aşağıdadır -
x değerleri yatay koordinatlar olan veri kümesidir.
y değerleri dikey koordinatlar olan veri kümesidir.
main grafiğin döşemesidir.
xlab yatay eksendeki etikettir.
ylab dikey eksendeki etikettir.
xlim çizim için kullanılan x değerlerinin sınırlarıdır.
ylim çizim için kullanılan y değerlerinin sınırlarıdır.
axes her iki eksenin de çizim üzerinde çizilip çizilmeyeceğini gösterir.
Misal
Veri setini kullanıyoruz "mtcars"R ortamında temel bir dağılım grafiği oluşturmak için kullanılabilir. Mtcarlarda "wt" ve "mpg" sütunlarını kullanalım.
input <- mtcars[,c('wt','mpg')]
print(head(input))
Yukarıdaki kodu çalıştırdığımızda şu sonucu verir -
wt mpg
Mazda RX4 2.620 21.0
Mazda RX4 Wag 2.875 21.0
Datsun 710 2.320 22.8
Hornet 4 Drive 3.215 21.4
Hornet Sportabout 3.440 18.7
Valiant 3.460 18.1
Dağılım Grafiği Oluşturma
Aşağıdaki komut dosyası, wt (ağırlık) ve mpg (galon başına mil) arasındaki ilişki için bir dağılım grafiği grafiği oluşturacaktır.
# Get the input values.
input <- mtcars[,c('wt','mpg')]
# Give the chart file a name.
png(file = "scatterplot.png")
# Plot the chart for cars with weight between 2.5 to 5 and mileage between 15 and 30.
plot(x = input$wt,y = input$mpg,
xlab = "Weight",
ylab = "Milage",
xlim = c(2.5,5),
ylim = c(15,30),
main = "Weight vs Milage"
)
# Save the file.
dev.off()
Yukarıdaki kodu çalıştırdığımızda şu sonucu verir -
Dağılım grafiği Matrisleri
İkiden fazla değişkenimiz olduğunda ve bir değişkenle diğer değişkenler arasındaki korelasyonu bulmak istediğimizde dağılım grafiği matrisini kullanırız. Kullanırızpairs() dağılım grafiklerinin matrislerini oluşturma işlevi.
Sözdizimi
R'de dağılım grafiği matrisleri oluşturmak için temel sözdizimi -
pairs(formula, data)
Kullanılan parametrelerin açıklaması aşağıdadır -
formula çiftler halinde kullanılan değişken serisini temsil eder.
data değişkenlerin alınacağı veri setini temsil eder.
Misal
Her değişken, kalan değişkenlerin her biri ile eşleştirilir. Her çift için bir dağılım grafiği çizilir.
# Give the chart file a name.
png(file = "scatterplot_matrices.png")
# Plot the matrices between 4 variables giving 12 plots.
# One variable with 3 others and total 4 variables.
pairs(~wt+mpg+disp+cyl,data = mtcars,
main = "Scatterplot Matrix")
# Save the file.
dev.off()
Yukarıdaki kod çalıştırıldığında aşağıdaki çıktıyı alırız.