Python'da Lojistik Regresyon - Test
Üretimde kullanıma sokmadan önce yukarıda oluşturulan sınıflandırıcıyı test etmemiz gerekir. Test, modelin istenen doğruluğu karşılamadığını ortaya çıkarsa, yukarıdaki sürece geri dönmemiz, başka bir özellik kümesi (veri alanları) seçmemiz, modeli yeniden oluşturmamız ve test etmemiz gerekir. Bu, sınıflandırıcı istenen doğruluk gereksiniminizi karşılayana kadar yinelemeli bir adım olacaktır. Öyleyse sınıflandırıcımızı test edelim.
Test Verilerini Tahmin Etme
Sınıflandırıcıyı test etmek için, önceki aşamada oluşturulan test verilerini kullanırız. Biz arıyoruzpredict yöntemi oluşturulan nesnede ve X aşağıdaki komutta gösterildiği gibi test verilerinin dizisi -
In [24]: predicted_y = classifier.predict(X_test)
Bu, tüm eğitim veri seti için X dizisindeki her satır için tahmin veren tek boyutlu bir dizi oluşturur. Aşağıdaki komutu kullanarak bu diziyi inceleyebilirsiniz -
In [25]: predicted_y
Aşağıdakiler, yukarıdaki iki komutun yürütülmesi üzerine çıktıdır -
Out[25]: array([0, 0, 0, ..., 0, 0, 0])
Çıktı, ilk ve son üç müşterinin potansiyel adaylar olmadığını göstermektedir. Term Deposit. Potansiyel müşterileri sıralamak için tüm diziyi inceleyebilirsiniz. Bunu yapmak için aşağıdaki Python kod parçacığını kullanın -
In [26]: for x in range(len(predicted_y)):
if (predicted_y[x] == 1):
print(x, end="\t")
Yukarıdaki kodu çalıştırmanın çıktısı aşağıda gösterilmiştir -
Çıktı, TD'ye abone olmak için muhtemel aday olan tüm satırların indekslerini gösterir. Artık bu çıktıyı, seçilen satırdaki her bir müşteri için iletişim bilgilerini alacak ve işlerine devam edecek olan bankanın pazarlama ekibine verebilirsiniz.
Bu modeli üretime sokmadan önce tahminin doğruluğunu kontrol etmemiz gerekiyor.
Doğruluğu Doğrulamak
Modelin doğruluğunu test etmek için, aşağıda gösterildiği gibi sınıflandırıcıdaki puan yöntemini kullanın -
In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))
Bu komutu çalıştırmanın ekran çıktısı aşağıda gösterilmiştir -
Accuracy: 0.90
Çoğu uygulamada çok iyi kabul edilen modelimizin doğruluğunun% 90 olduğunu göstermektedir. Bu nedenle, daha fazla ayar yapmaya gerek yoktur. Artık müşterimiz bir sonraki kampanyayı yürütmeye, potansiyel müşterilerin listesini almaya ve olası bir yüksek başarı oranıyla TD'yi açmak için onları kovalamaya hazır.