Regresi Logistik dengan Python - Pengujian
Kita perlu menguji pengklasifikasi yang dibuat di atas sebelum menggunakannya untuk produksi. Jika pengujian menunjukkan bahwa model tidak memenuhi akurasi yang diinginkan, kita harus kembali ke proses di atas, memilih kumpulan fitur lain (kolom data), membuat model lagi, dan mengujinya. Ini akan menjadi langkah berulang sampai pengklasifikasi memenuhi persyaratan akurasi yang Anda inginkan. Jadi mari kita uji pengklasifikasi kita.
Memprediksi Data Uji
Untuk menguji pengklasifikasi, kami menggunakan data pengujian yang dihasilkan pada tahap sebelumnya. Kami menyebutnyapredict metode pada objek yang dibuat dan meneruskan X larik data uji seperti yang ditunjukkan pada perintah berikut -
In [24]: predicted_y = classifier.predict(X_test)
Ini menghasilkan array dimensi tunggal untuk seluruh kumpulan data pelatihan yang memberikan prediksi untuk setiap baris dalam array X. Anda dapat memeriksa array ini dengan menggunakan perintah berikut -
In [25]: predicted_y
Berikut ini adalah output dari eksekusi dua perintah di atas -
Out[25]: array([0, 0, 0, ..., 0, 0, 0])
Output tersebut menunjukkan bahwa tiga pelanggan pertama dan terakhir bukanlah calon potensial untuk Term Deposit. Anda dapat memeriksa seluruh larik untuk menyortir calon pelanggan. Untuk melakukannya, gunakan cuplikan kode Python berikut -
In [26]: for x in range(len(predicted_y)):
if (predicted_y[x] == 1):
print(x, end="\t")
Output dari menjalankan kode di atas ditunjukkan di bawah ini -
Outputnya menunjukkan indeks dari semua baris yang merupakan kandidat potensial untuk berlangganan TD. Anda sekarang dapat memberikan hasil ini kepada tim pemasaran bank yang akan mengambil detail kontak untuk setiap pelanggan di baris yang dipilih dan melanjutkan pekerjaan mereka.
Sebelum kami memasukkan model ini ke dalam produksi, kami perlu memverifikasi keakuratan prediksi.
Memverifikasi Akurasi
Untuk menguji keakuratan model, gunakan metode skor pada pengklasifikasi seperti yang ditunjukkan di bawah ini -
In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))
Output layar dari menjalankan perintah ini ditunjukkan di bawah ini -
Accuracy: 0.90
Ini menunjukkan bahwa akurasi model kami adalah 90% yang dianggap sangat baik di sebagian besar aplikasi. Dengan demikian, tidak diperlukan penyetelan lebih lanjut. Sekarang, pelanggan kami siap untuk menjalankan kampanye berikutnya, dapatkan daftar pelanggan potensial dan kejar mereka untuk membuka TD dengan kemungkinan tingkat keberhasilan yang tinggi.