Veri Madenciliği - Bayes Sınıflandırması
Bayesçi sınıflandırma, Bayes Teoremine dayanmaktadır. Bayes sınıflandırıcıları istatistiksel sınıflandırıcılardır. Bayes sınıflandırıcıları, belirli bir demetin belirli bir sınıfa ait olma olasılığı gibi sınıf üyelik olasılıklarını tahmin edebilir.
Bayes teoremi
Bayes Teoremi, Thomas Bayes'in adını almıştır. İki tür olasılık vardır -
- Posterior Olasılık [P (H / X)]
- Önceki Olasılık [P (H)]
burada X veri grubu ve H bir hipotezdir.
Bayes Teoremine göre,
Bayesçi İnanç Ağı
Bayesçi İnanç Ağları, ortak koşullu olasılık dağılımlarını belirtir. Ayrıca İnanç Ağları, Bayes Ağları veya Olasılık Ağları olarak da bilinirler.
Bir İnanç Ağı, değişkenlerin alt kümeleri arasında sınıf koşullu bağımsızlıklarının tanımlanmasına izin verir.
Öğrenmenin gerçekleştirilebileceği nedensel ilişkinin grafiksel bir modelini sağlar.
Sınıflandırma için eğitimli bir Bayes Ağı kullanabiliriz.
Bayesçi bir İnanç Ağını tanımlayan iki bileşen vardır:
- Yönlendirilmiş döngüsüz grafiği
- Bir dizi koşullu olasılık tablosu
Yönlendirilmiş döngüsüz grafiği
- Yönlendirilmiş döngüsel olmayan grafikteki her düğüm rastgele bir değişkeni temsil eder.
- Bu değişken, ayrı veya sürekli değerli olabilir.
- Bu değişkenler, verilerde verilen gerçek özniteliğe karşılık gelebilir.
Yönlendirilmiş Asiklik Grafik Gösterimi
Aşağıdaki diyagram, altı Boole değişkeni için yönlendirilmiş bir çevrimsiz grafiği göstermektedir.
Diyagramdaki yay, nedensel bilginin temsiline izin verir. Örneğin, akciğer kanseri, kişinin ailesinde akciğer kanseri geçmişinden ve kişinin sigara içip içmemesinden etkilenir. Hastanın akciğer kanseri olduğunu bildiğimiz için PositiveXray değişkeninin, hastanın ailesinde akciğer kanseri öyküsü olup olmadığından veya hastanın sigara içen olduğundan bağımsız olduğunu belirtmek gerekir.
Koşullu Olasılık Tablosu
Ana düğümleri, FamilyHistory (FH) ve Smoker (S) değerlerinin her olası kombinasyonunu gösteren değişken LungCancer (LC) değerleri için koşullu olasılık tablosu aşağıdaki gibidir -