Логистическая регрессия в Python - Введение

Логистическая регрессия - это статистический метод классификации объектов. Эта глава даст введение в логистическую регрессию с помощью некоторых примеров.

Классификация

Чтобы понять логистическую регрессию, вы должны знать, что означает классификация. Давайте рассмотрим следующие примеры, чтобы лучше понять это -

  • Врач классифицирует опухоль как злокачественную или доброкачественную.
  • Банковская транзакция может быть мошеннической или подлинной.

На протяжении многих лет люди выполняли такие задачи, хотя и подвержены ошибкам. Вопрос в том, можем ли мы научить машины выполнять эти задачи с большей точностью?

Одним из таких примеров машин, выполняющих классификацию, является электронное письмо. Clientна вашем компьютере, который классифицирует каждую входящую почту как «спам» или «не спам» и делает это с довольно большой точностью. Статистический метод логистической регрессии успешно применен в почтовом клиенте. В этом случае мы обучили нашу машину решать задачу классификации.

Логистическая регрессия - это лишь одна часть машинного обучения, используемая для решения такого рода задач двоичной классификации. Есть несколько других методов машинного обучения, которые уже разработаны и используются на практике для решения других видов проблем.

Если вы заметили, во всех приведенных выше примерах результат предсказания имеет только два значения - Да или Нет. Мы называем их классами, чтобы сказать, что наш классификатор классифицирует объекты по двум классам. С технической точки зрения, мы можем сказать, что переменная результата или целевая переменная имеет дихотомический характер.

Существуют и другие проблемы классификации, при которых выходные данные можно разделить более чем на два класса. Например, если дана корзина, полная фруктов, вас просят разделить фрукты разных видов. Теперь в корзине могут быть апельсины, яблоки, манго и так далее. Итак, когда вы разделяете фрукты, вы разделяете их более чем на два класса. Это многомерная задача классификации.