Çeşitli Sınıflandırma Yöntemleri
Burada Genetik Algoritmalar, Kaba Küme Yaklaşımı ve Bulanık Küme Yaklaşımı gibi diğer sınıflandırma yöntemlerini tartışacağız.
Genetik Algoritmalar
Genetik algoritma fikri doğal evrimden türetilmiştir. Genetik algoritmada öncelikle ilk popülasyon oluşturulur. Bu ilk popülasyon, rastgele oluşturulmuş kurallardan oluşur. Her kuralı bir bit dizisi ile temsil edebiliriz.
Örneğin, belirli bir eğitim setinde örnekler, A1 ve A2 gibi iki Boole özelliği ile tanımlanır. Ve verilen bu eğitim seti C1 ve C2 gibi iki sınıf içerir.
Kuralı kodlayabiliriz IF A1 AND NOT A2 THEN C2 biraz dizeye 100. Bu bit gösteriminde, en soldaki iki bit sırasıyla A1 ve A2 özelliğini temsil eder.
Aynı şekilde kural IF NOT A1 AND NOT A2 THEN C1 olarak kodlanabilir 001.
Note- Eğer öznitelik K> 2 olduğunda K değerlerine sahipse, öznitelik değerlerini kodlamak için K bitlerini kullanabiliriz. Sınıflar da aynı şekilde kodlanmıştır.
Hatırlanması gereken noktalar -
En güçlü olanın hayatta kalması fikrine dayanılarak, mevcut popülasyondaki en uygun kurallar ve bu kuralların yavru değerlerinden oluşan yeni bir popülasyon oluşur.
Bir kuralın uygunluğu, bir dizi eğitim örneği üzerindeki sınıflandırma doğruluğu ile değerlendirilir.
Yavru oluşturmak için çapraz geçiş ve mutasyon gibi genetik operatörler uygulanır.
Çaprazlamada, yeni bir kural çifti oluşturmak için kural çiftinin alt dizesi değiştirilir.
Mutasyonda, bir kuralın dizesindeki rastgele seçilen bitler ters çevrilir.
Kaba Set Yaklaşımı
Belirsiz ve gürültülü verilerdeki yapısal ilişkiyi keşfetmek için kaba küme yaklaşımını kullanabiliriz.
Note- Bu yaklaşım yalnızca ayrık değerli özniteliklere uygulanabilir. Bu nedenle, sürekli değerli öznitelikler, kullanılmadan önce ayrıştırılmalıdır.
Kaba Küme Teorisi, verilen eğitim verileri içinde denklik sınıflarının oluşturulmasına dayanmaktadır. Eşdeğerlik sınıfını oluşturan tuplelar ayırt edilemez. Verileri açıklayan niteliklere göre örneklerin aynı olduğu anlamına gelir.
Verilen gerçek dünya verilerinde mevcut özellikler açısından ayırt edilemeyen bazı sınıflar vardır. Kaba setleri kullanabilirizroughly bu tür sınıfları tanımlayın.
Belirli bir C sınıfı için, kaba küme tanımına aşağıdaki gibi iki küme yaklaşılır -
Lower Approximation of C - C'nin daha düşük yaklaşımı, özniteliğin bilgisine dayalı olarak C sınıfına ait olduğu kesin olan tüm veri gruplarından oluşur.
Upper Approximation of C - C'nin üst yaklaşımı, özniteliklerin bilgisine dayalı olarak C'ye ait olmadığı şeklinde tanımlanamayan tüm tuple'lerden oluşur.
Aşağıdaki diyagram C sınıfının Üst ve Alt Yaklaşımını göstermektedir -
Bulanık Küme Yaklaşımları
Bulanık Küme Teorisi, Olasılık Teorisi olarak da adlandırılır. Bu teori, 1965'te Lotfi Zadeh tarafından alternatif olarak önerildi.two-value logic ve probability theory. Bu teori, yüksek bir soyutlama seviyesinde çalışmamızı sağlar. Ayrıca, verilerin kesin olmayan ölçümleriyle başa çıkmamız için araçlar sağlar.
Bulanık küme teorisi ayrıca belirsiz veya kesin olmayan gerçeklerle başa çıkmamıza izin verir. Örneğin, yüksek gelirli bir grubun üyesi olmak tam anlamıyla geçerlidir (örneğin 50.000 $ yüksekse 49.000 $ ve 48.000 $ 'a ne dersiniz). Elemanın ya S'ye ya da onun tamamlayıcısına ait olduğu geleneksel CRISP kümesinin aksine, ancak bulanık küme teorisinde eleman birden fazla bulanık kümeye ait olabilir.
Örneğin, 49.000 dolarlık gelir değeri hem orta hem de yüksek bulanık kümelere aittir, ancak farklı derecelerdedir. Bu gelir değeri için bulanık küme gösterimi aşağıdaki gibidir -
mmedium_income($49k)=0.15 and mhigh_income($49k)=0.96
burada 'm', sırasıyla orta_gelir ve yüksek_ gelirin bulanık kümeleri üzerinde çalışan üyelik işlevidir. Bu gösterim şematik olarak aşağıdaki gibi gösterilebilir -