Regressão logística em Python - estudo de caso
Considere que um banco o aborda para desenvolver um aplicativo de aprendizado de máquina que os ajudará a identificar os clientes em potencial que abririam um depósito a prazo (também chamado de depósito fixo por alguns bancos) com eles. O banco realiza regularmente pesquisas por meio de ligações telefônicas ou formulários da web para coletar informações sobre os potenciais clientes. A pesquisa é de natureza geral e é conduzida para um público muito grande, do qual muitos podem não estar interessados em negociar com o próprio banco. Do resto, apenas alguns podem estar interessados em abrir um depósito a prazo. Outros podem estar interessados em outras facilidades oferecidas pelo banco. Portanto, a pesquisa não é necessariamente conduzida para identificar os clientes que estão abrindo TDs. Sua tarefa é identificar todos os clientes com alta probabilidade de abrir o TD a partir dos enormes dados de pesquisa que o banco vai compartilhar com você.
Felizmente, um desses tipos de dados está disponível publicamente para aqueles que desejam desenvolver modelos de aprendizado de máquina. Estes dados foram preparados por alguns alunos da UC Irvine com financiamento externo. O banco de dados está disponível como parte deUCI Machine Learning Repositorye é amplamente utilizado por estudantes, educadores e pesquisadores em todo o mundo. Os dados podem ser baixados aqui .
Nos próximos capítulos, vamos agora realizar o desenvolvimento do aplicativo usando os mesmos dados.