Python'da Lojistik Regresyon - Giriş

Lojistik Regresyon, nesnelerin sınıflandırılması için istatistiksel bir yöntemdir. Bu bölüm, bazı örneklerin yardımıyla lojistik regresyona bir giriş verecektir.

Sınıflandırma

Lojistik regresyonu anlamak için sınıflandırmanın ne anlama geldiğini bilmelisiniz. Bunu daha iyi anlamak için aşağıdaki örnekleri ele alalım -

  • Bir doktor, tümörü kötü huylu veya iyi huylu olarak sınıflandırır.
  • Bir banka işlemi sahte veya gerçek olabilir.

Uzun yıllardır insanlar bu tür görevleri yerine getiriyorlar - hataya açık olsalar da. Soru şu ki, makineleri bizim için bu görevleri daha iyi bir doğrulukla yapacak şekilde eğitebilir miyiz?

Sınıflandırmayı yapan makinelere böyle bir örnek, e-postadır Clientmakinenizde gelen her postayı "spam" veya "spam değil" olarak sınıflandırır ve oldukça büyük bir doğrulukla yapar. Lojistik regresyonun istatistiksel tekniği, e-posta istemcisinde başarıyla uygulandı. Bu durumda, makinemizi bir sınıflandırma problemini çözmek için eğittik.

Lojistik Regresyon, bu tür ikili sınıflandırma problemini çözmek için kullanılan makine öğreniminin yalnızca bir parçasıdır. Halihazırda geliştirilmiş ve başka türden problemleri çözmek için uygulamada olan birkaç başka makine öğrenimi tekniği vardır.

Yukarıdaki tüm örneklerde, tahminin sonucunun yalnızca iki değeri olduğunu fark ettiyseniz - Evet veya Hayır. Bunlara sınıflar diyoruz - böylece sınıflandırıcımızın nesneleri iki sınıfta sınıflandırdığını söyleyelim. Teknik terimlerle, sonuç veya hedef değişkenin doğası gereği ikiye bölünmüş olduğunu söyleyebiliriz.

Çıktının ikiden fazla sınıfa sınıflandırılabileceği başka sınıflandırma problemleri vardır. Örneğin, meyve dolu bir sepet verildiğinde, farklı türdeki meyveleri ayırmanız istenir. Şimdi sepet, Portakal, Elma, Mango vb. İçerebilir. Yani meyveleri ayırdığınızda, onları ikiden fazla sınıfa ayırırsınız. Bu çok değişkenli bir sınıflandırma problemidir.