Veri Analizi için Makine Öğrenimi
Makine öğrenimi, örüntü tanıma, bilgisayar görüşü, konuşma tanıma, metin analitiği gibi görevlerle ilgilenen ve istatistik ve matematiksel optimizasyonla güçlü bir bağlantısı olan bir bilgisayar bilimi alt alanıdır. Uygulamalar arasında arama motorlarının geliştirilmesi, spam filtreleme, Optik Karakter Tanıma (OCR) ve diğerleri bulunmaktadır. Veri madenciliği, örüntü tanıma ve istatistiksel öğrenme alanı arasındaki sınırlar net değildir ve temelde tümü benzer sorunlara işaret eder.
Makine öğrenimi iki tür göreve ayrılabilir -
- Denetimli Öğrenme
- Denetimsiz Öğrenme
Denetimli Öğrenme
Denetimli öğrenme, bir X matrisi olarak tanımlanan bir girdi verisinin olduğu ve bir y yanıtını tahmin etmekle ilgilendiğimiz bir tür problemi ifade eder . Burada X = {x 1 x 2 , ..., x, n, } sahiptir , n prediktörleri ve iki değer vardır {C y = 1 c 2 } .
Örnek bir uygulama, bir web kullanıcısının tahmini olarak demografik özellikleri kullanarak reklamları tıklama olasılığını tahmin etmektir. Bu genellikle tıklama oranını (TO) tahmin etmek için çağrılır. Sonra y = {tıklama, tıklamaz - tıklama} ve tahmin ediciler, kullanılabilecek diğer özelliklerin yanı sıra kullanılan IP adresi, siteye girdiği gün, kullanıcının şehri, ülkesi olabilir.
Denetimsiz Öğrenme
Denetimsiz öğrenme, öğrenecek bir sınıfa sahip olmadan birbiriyle benzer olan grupları bulma sorunuyla ilgilenir. Tahmin edicilerden, her grupta benzer örnekleri paylaşan ve birbirlerinden farklı olan grupları bulmaya kadar bir eşleme öğrenme görevine yönelik çeşitli yaklaşımlar vardır.
Denetimsiz öğrenmenin örnek bir uygulaması müşteri segmentasyonudur. Örneğin, telekomünikasyon endüstrisinde ortak bir görev, kullanıcıları telefona verdikleri kullanıma göre bölümlere ayırmaktır. Bu, pazarlama departmanının her grubu farklı bir ürünle hedeflemesine izin verecektir.