Regresi Logistik dengan Python - Studi Kasus
Pertimbangkan bahwa bank mendekati Anda untuk mengembangkan aplikasi pembelajaran mesin yang akan membantu mereka mengidentifikasi klien potensial yang akan membuka Deposito Berjangka (juga disebut Deposit Tetap oleh beberapa bank) dengan mereka. Bank secara teratur melakukan survei melalui panggilan telepon atau formulir web untuk mengumpulkan informasi tentang calon klien. Survei ini bersifat umum dan dilakukan pada audiens yang sangat besar sehingga banyak yang tidak tertarik untuk berurusan dengan bank ini sendiri. Dari sisanya, hanya sedikit yang tertarik membuka Deposito Berjangka. Orang lain mungkin tertarik dengan fasilitas lain yang ditawarkan oleh bank. Jadi survei tidak perlu dilakukan untuk mengidentifikasi nasabah yang membuka TD. Tugas Anda adalah mengidentifikasi semua pelanggan dengan probabilitas tinggi untuk membuka TD dari data survei yang sangat besar yang akan dibagikan oleh bank kepada Anda.
Untungnya, satu jenis data seperti itu tersedia untuk umum bagi mereka yang ingin mengembangkan model pembelajaran mesin. Data ini disiapkan oleh beberapa mahasiswa di UC Irvine dengan pendanaan eksternal. Basis data tersedia sebagai bagian dariUCI Machine Learning Repositorydan digunakan secara luas oleh siswa, pendidik, dan peneliti di seluruh dunia. Datanya bisa diunduh dari sini .
Pada bab-bab selanjutnya, sekarang mari kita melakukan pengembangan aplikasi menggunakan data yang sama.