Hồi quy logistic trong Python - Bộ phân loại xây dựng
Không bắt buộc bạn phải xây dựng bộ phân loại từ đầu. Việc xây dựng bộ phân loại rất phức tạp và đòi hỏi kiến thức về một số lĩnh vực như Thống kê, lý thuyết xác suất, kỹ thuật tối ưu hóa, v.v. Có một số thư viện được tạo sẵn trên thị trường có khả năng triển khai các bộ phân loại này đã được kiểm tra đầy đủ và rất hiệu quả. Chúng tôi sẽ sử dụng một mô hình được tạo sẵn như vậy từsklearn.
Bộ phân loại sklearn
Việc tạo bộ phân loại hồi quy Logistic từ bộ công cụ sklearn là không cần thiết và được thực hiện trong một câu lệnh chương trình duy nhất như được hiển thị ở đây -
In [22]: classifier = LogisticRegression(solver='lbfgs',random_state=0)
Khi trình phân loại được tạo, bạn sẽ cung cấp dữ liệu đào tạo của mình vào trình phân loại để nó có thể điều chỉnh các thông số bên trong và sẵn sàng cho các dự đoán về dữ liệu trong tương lai của bạn. Để điều chỉnh trình phân loại, chúng tôi chạy câu lệnh sau:
In [23]: classifier.fit(X_train, Y_train)
Bộ phân loại hiện đã sẵn sàng để thử nghiệm. Đoạn mã sau là kết quả của việc thực thi hai câu lệnh trên:
Out[23]: LogisticRegression(C = 1.0, class_weight = None, dual = False,
fit_intercept=True, intercept_scaling=1, max_iter=100,
multi_class='warn', n_jobs=None, penalty='l2', random_state=0,
solver='lbfgs', tol=0.0001, verbose=0, warm_start=False))
Bây giờ, chúng tôi đã sẵn sàng để kiểm tra trình phân loại đã tạo. Chúng ta sẽ giải quyết vấn đề này trong chương tiếp theo.