ggplot2 - Dağılım Grafikleri ve Değişme Grafikleri
Dağılım Grafikleri, genellikle çizim için kullanılan çizgi grafiklere benzer. Dağılım grafikleri, bir değişkenin diğeriyle ne kadar ilişkili olduğunu gösterir. Değişkenler arasındaki ilişki, genellikle istatistiksel yöntemlerde kullanılan korelasyon olarak adlandırılır. Her değişken arasında birçok varyasyon içeren "Iris" adlı aynı veri kümesini kullanacağız. Bu, 3 iris türünün her birinden 50 çiçek için petal uzunluğu ve genişliği ile birlikte, ayrı uzunluk ve genişlik değişkenlerinin santimetre cinsinden ölçümlerini veren ünlü veri kümesidir. Türlere Iris setosa, versicolor ve virginica denir.
Temel Dağılım Grafiği Oluşturma
"Ggplot2" paketi ile dağılım grafikleri oluşturmak için aşağıdaki adımlar uygulanır -
Temel bir dağılım grafiği oluşturmak için aşağıdaki komut yürütülür -
> # Basic Scatter Plot
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+ geom_point()
Öznitelikler eklemek
Geom_point () fonksiyonunda şekil adı verilen bir özellik ile noktaların şeklini değiştirebiliriz.
> # Change the shape of points
> ggplot(iris, aes(Sepal.Length, Petal.Length)) +
+ geom_point(shape=1)
Gerekli dağılım grafiklerine eklenen noktalara renk katabiliriz.
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+ geom_point(shape=1)
Bu örnekte, efsanelerde adı geçen türe göre renkler oluşturduk. Üç tür, belirtilen arsada benzersiz bir şekilde ayırt edilir.
Şimdi değişkenler arasında ilişki kurmaya odaklanacağız.
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+ geom_point(shape=1) +
+ geom_smooth(method=lm)
geom_smooth işlev, örtüşme modeline ve gerekli değişkenlerin modelini oluşturmaya yardımcı olur.
Öznitelik yöntemi "lm", geliştirilmesi gereken regresyon çizgisinden bahseder.
> # Add a regression line
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+ geom_point(shape=1) +
+ geom_smooth(method=lm)
Aşağıda belirtilen sözdizimi ile gölgeli güven bölgesi olmayan bir regresyon çizgisi de ekleyebiliriz -
># Add a regression line but no shaded confidence region
> ggplot(iris, aes(Sepal.Length, Petal.Length, colour=Species)) +
+ geom_point(shape=1) +
+ geom_smooth(method=lm, se=FALSE)
Gölgeli bölgeler, güven bölgeleri dışındaki şeyleri temsil eder.
Jitter Grafikleri
Jitter grafikleri, dağınık grafiklerin gösterilebileceği özel efektler içerir. Jitter, noktaları aşağıda belirtildiği gibi ayırmak için atanan rastgele bir değerden başka bir şey değildir -
> ggplot(mpg, aes(cyl, hwy)) +
+ geom_point() +
+ geom_jitter(aes(colour = class))