Pythonでのロジスティック回帰-ケーススタディ

ある銀行が、定期預金(一部の銀行では定期預金とも呼ばれます)を開く可能性のあるクライアントを特定するのに役立つ機械学習アプリケーションを開発するようにあなたにアプローチするとします。銀行は、潜在的な顧客に関する情報を収集するために、電話またはWebフォームを使用して定期的に調査を実施しています。調査は本質的に一般的なものであり、非常に多くの聴衆を対象に実施されており、その多くはこの銀行自体との取引に興味がない可能性があります。残りのうち、定期預金の開設に関心があるのはごくわずかです。他の人は銀行が提供する他の施設に興味があるかもしれません。したがって、調査は必ずしもTDを開く顧客を特定するために実施されるわけではありません。あなたの仕事は、銀行があなたと共有しようとしている膨大な調査データから、TDを開く可能性が高いすべての顧客を特定することです。

幸いなことに、そのような種類のデータの1つは、機械学習モデルの開発を目指す人々のために公開されています。このデータは、カリフォルニア大学アーバイン校の一部の学生が外部資金で作成したものです。データベースはの一部として利用可能ですUCI Machine Learning Repositoryまた、世界中の学生、教育者、研究者によって広く使用されています。データはこちらからダウンロードできます。

次の章では、同じデータを使用してアプリケーション開発を実行しましょう。