Hồi quy logistic trong Python - Thử nghiệm
Chúng ta cần kiểm tra trình phân loại đã tạo ở trên trước khi đưa vào sử dụng sản xuất. Nếu quá trình kiểm tra cho thấy mô hình không đạt độ chính xác mong muốn, chúng tôi sẽ phải quay lại quá trình trên, chọn một tập hợp các tính năng khác (trường dữ liệu), xây dựng lại mô hình và kiểm tra nó. Đây sẽ là một bước lặp đi lặp lại cho đến khi trình phân loại đáp ứng yêu cầu của bạn về độ chính xác mong muốn. Vì vậy, hãy để chúng tôi kiểm tra trình phân loại của chúng tôi.
Dự đoán dữ liệu thử nghiệm
Để kiểm tra trình phân loại, chúng tôi sử dụng dữ liệu kiểm tra được tạo ở giai đoạn trước. Chúng tôi gọi làpredict phương thức trên đối tượng đã tạo và chuyển X mảng dữ liệu thử nghiệm như được hiển thị trong lệnh sau:
In [24]: predicted_y = classifier.predict(X_test)
Điều này tạo ra một mảng một chiều cho toàn bộ tập dữ liệu huấn luyện đưa ra dự đoán cho mỗi hàng trong mảng X. Bạn có thể kiểm tra mảng này bằng cách sử dụng lệnh sau:
In [25]: predicted_y
Sau đây là kết quả khi thực hiện hai lệnh trên:
Out[25]: array([0, 0, 0, ..., 0, 0, 0])
Kết quả chỉ ra rằng ba khách hàng đầu tiên và cuối cùng không phải là ứng viên tiềm năng cho Term Deposit. Bạn có thể kiểm tra toàn bộ mảng để phân loại khách hàng tiềm năng. Để làm như vậy, hãy sử dụng đoạn mã Python sau:
In [26]: for x in range(len(predicted_y)):
if (predicted_y[x] == 1):
print(x, end="\t")
Kết quả của việc chạy mã trên được hiển thị bên dưới:
Kết quả đầu ra hiển thị chỉ mục của tất cả các hàng là ứng cử viên có thể đăng ký TD. Bây giờ, bạn có thể cung cấp kết quả này cho nhóm tiếp thị của ngân hàng, những người sẽ lấy chi tiết liên hệ của từng khách hàng trong hàng đã chọn và tiến hành công việc của họ.
Trước khi đưa mô hình này vào sản xuất, chúng tôi cần xác minh tính chính xác của dự đoán.
Xác minh độ chính xác
Để kiểm tra độ chính xác của mô hình, hãy sử dụng phương pháp cho điểm trên bộ phân loại như hình dưới đây:
In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))
Đầu ra màn hình của việc chạy lệnh này được hiển thị bên dưới:
Accuracy: 0.90
Nó cho thấy độ chính xác của mô hình của chúng tôi là 90%, được coi là rất tốt trong hầu hết các ứng dụng. Do đó, không cần điều chỉnh thêm. Bây giờ, khách hàng của chúng tôi đã sẵn sàng chạy chiến dịch tiếp theo, lấy danh sách khách hàng tiềm năng và theo đuổi họ để mở TD với tỷ lệ thành công cao.