Python의 로지스틱 회귀-소개
로지스틱 회귀는 개체를 통계적으로 분류하는 방법입니다. 이 장에서는 몇 가지 예를 사용하여 로지스틱 회귀를 소개합니다.
분류
로지스틱 회귀를 이해하려면 분류의 의미를 알아야합니다. 이것을 더 잘 이해하기 위해 다음 예를 고려해 보겠습니다.
- 의사는 종양을 악성 또는 양성으로 분류합니다.
- 은행 거래는 사기이거나 진짜 일 수 있습니다.
수년 동안 인간은 오류가 발생하기 쉽지만 이러한 작업을 수행해 왔습니다. 문제는 이러한 작업을보다 정확하게 수행하도록 기계를 훈련시킬 수 있는가?
분류를 수행하는 기계의 한 가지 예는 이메일입니다. Client모든 수신 메일을 "스팸"또는 "스팸 아님"으로 분류하고 상당히 정확하게 수행합니다. 로지스틱 회귀 통계 기법이 이메일 클라이언트에 성공적으로 적용되었습니다. 이 경우 분류 문제를 해결하도록 기계를 훈련했습니다.
로지스틱 회귀는 이러한 종류의 이진 분류 문제를 해결하는 데 사용되는 기계 학습의 한 부분 일뿐입니다. 이미 개발되어 다른 종류의 문제를 해결하기 위해 실제로 사용되고있는 몇 가지 다른 기계 학습 기술이 있습니다.
위의 모든 예에서 예측의 결과는 예 또는 아니오라는 두 가지 값만 가지고 있습니다.이를 클래스라고 부르기 때문에 분류자가 객체를 두 클래스로 분류한다고 말합니다. 기술적 인 측면에서 결과 또는 목표 변수는 본질적으로 이분법 적이라고 말할 수 있습니다.
출력이 두 개 이상의 클래스로 분류 될 수있는 다른 분류 문제가 있습니다. 예를 들어, 과일로 가득 찬 바구니가 주어지면 다른 종류의 과일을 분리하라는 요청을받습니다. 이제 바구니에는 오렌지, 사과, 망고 등이 포함될 수 있습니다. 따라서 과일을 분리 할 때 두 개 이상의 클래스로 분리합니다. 이것은 다변량 분류 문제입니다.