Логистическая регрессия в Python - пример из практики
Учтите, что банк обращается к вам с просьбой разработать приложение для машинного обучения, которое поможет им определить потенциальных клиентов, которые откроют для них срочный депозит (также называемый фиксированным депозитом в некоторых банках). Банк регулярно проводит опросы посредством телефонных звонков или веб-форм для сбора информации о потенциальных клиентах. Опрос носит общий характер и проводится с очень большой аудиторией, многие из которых могут быть не заинтересованы в работе с самим этим банком. Из остальных лишь немногие могут быть заинтересованы в открытии Срочного депозита. Других могут заинтересовать другие услуги, предлагаемые банком. Так что опрос не обязательно проводится для выявления клиентов, открывающих ТД. Ваша задача - определить всех этих клиентов с высокой вероятностью открытия TD на основе огромных данных опроса, которыми банк собирается с вами поделиться.
К счастью, один из таких данных общедоступен для тех, кто стремится разработать модели машинного обучения. Эти данные были подготовлены некоторыми студентами Калифорнийского университета в Ирвине при внешнем финансировании. База данных доступна в составеUCI Machine Learning Repositoryи широко используется студентами, преподавателями и исследователями во всем мире. Данные можно скачать отсюда .
В следующих главах давайте теперь выполним разработку приложения с использованием тех же данных.