Pythonでのロジスティック回帰-はじめに
ロジスティック回帰は、オブジェクトを分類する統計的方法です。この章では、いくつかの例を使用してロジスティック回帰を紹介します。
分類
ロジスティック回帰を理解するには、分類の意味を知っておく必要があります。これをよりよく理解するために、次の例を考えてみましょう-
- 医師は腫瘍を悪性または良性に分類します。
- 銀行取引は詐欺的または本物である可能性があります。
何年もの間、人間はそのようなタスクを実行してきました-それらはエラーが発生しやすいですが。問題は、これらのタスクをより正確に実行するようにマシンをトレーニングできるかどうかです。
分類を行うマシンのそのような例の1つは、電子メールです。 Clientすべての受信メールを「スパム」または「非スパム」として分類するマシン上で、かなり高い精度でそれを行います。ロジスティック回帰の統計的手法は、電子メールクライアントに正常に適用されています。この場合、分類の問題を解決するためにマシンをトレーニングしました。
ロジスティック回帰は、この種の二項分類問題を解決するために使用される機械学習のほんの一部です。すでに開発され、他の種類の問題を解決するために実際に使用されている他のいくつかの機械学習手法があります。
上記のすべての例で、予測の結果には2つの値(YesまたはNo)しかありません。これらをクラスと呼びます。つまり、分類子はオブジェクトを2つのクラスに分類します。技術的には、結果またはターゲット変数は本質的に二分法であると言えます。
出力が3つ以上のクラスに分類される可能性がある他の分類問題があります。たとえば、果物がいっぱい入ったバスケットがある場合、さまざまな種類の果物を分けるように求められます。現在、バスケットにはオレンジ、リンゴ、マンゴーなどが含まれている可能性があります。したがって、果物を分離するときは、3つ以上のクラスに分けます。これは多変量分類の問題です。