Régression logistique en Python - Étude de cas
Considérez qu'une banque vous approche pour développer une application d'apprentissage automatique qui les aidera à identifier les clients potentiels qui ouvriraient un dépôt à terme (également appelé dépôt fixe par certaines banques) avec eux. La banque mène régulièrement une enquête au moyen d'appels téléphoniques ou de formulaires Web pour recueillir des informations sur les clients potentiels. L'enquête est de nature générale et est menée auprès d'un très large public, dont beaucoup pourraient ne pas être intéressés à traiter avec cette banque elle-même. Sur le reste, seuls quelques-uns pourraient être intéressés par l'ouverture d'un dépôt à terme. D'autres peuvent être intéressés par d'autres facilités offertes par la banque. L'enquête n'est donc pas nécessairement menée pour identifier les clients qui ouvrent des TD. Votre tâche consiste à identifier tous les clients à forte probabilité d'ouvrir TD à partir des énormes données d'enquête que la banque va partager avec vous.
Heureusement, un tel type de données est accessible au public pour ceux qui aspirent à développer des modèles d'apprentissage automatique. Ces données ont été préparées par certains étudiants de l'UC Irvine avec un financement externe. La base de données est disponible dans le cadre deUCI Machine Learning Repositoryet est largement utilisé par les étudiants, les éducateurs et les chercheurs du monde entier. Les données peuvent être téléchargées à partir d' ici .
Dans les chapitres suivants, effectuons maintenant le développement de l'application en utilisant les mêmes données.