Regresja logistyczna w Pythonie - podsumowanie
Regresja logistyczna to statystyczna technika klasyfikacji binarnej. W tym samouczku nauczyłeś się, jak wyszkolić maszynę do korzystania z regresji logistycznej. Tworząc modele uczenia maszynowego, najważniejszym wymaganiem jest dostępność danych. Bez odpowiednich i istotnych danych nie można po prostu zmusić maszyny do uczenia się.
Gdy masz już dane, następnym ważnym zadaniem jest wyczyszczenie danych, wyeliminowanie niechcianych wierszy, pól i wybranie odpowiednich pól do opracowania modelu. Po wykonaniu tej czynności musisz zmapować dane do formatu wymaganego przez klasyfikator do jego uczenia. Dlatego przygotowanie danych jest głównym zadaniem w każdej aplikacji do uczenia maszynowego. Gdy jesteś gotowy z danymi, możesz wybrać określony typ klasyfikatora.
W tym samouczku dowiedziałeś się, jak używać klasyfikatora regresji logistycznej udostępnionego w sklearnbiblioteka. Aby wytrenować klasyfikator, używamy około 70% danych do uczenia modelu. Resztę danych wykorzystujemy do testów. Testujemy dokładność modelu. Jeśli to nie mieści się w dopuszczalnych granicach, wracamy do wyboru nowego zestawu funkcji.
Ponownie prześledź cały proces przygotowania danych, wytrenuj model i testuj, aż będziesz zadowolony z jego dokładności. Przed podjęciem jakiegokolwiek projektu związanego z uczeniem maszynowym musisz się nauczyć i mieć kontakt z szeroką gamą technik, które zostały opracowane do tej pory i zostały z powodzeniem zastosowane w branży.