Thiết lập một dự án
Trong chương này, chúng ta sẽ hiểu chi tiết về quy trình liên quan đến việc thiết lập một dự án để thực hiện hồi quy logistic bằng Python.
Cài đặt Jupyter
Chúng tôi sẽ sử dụng Jupyter - một trong những nền tảng được sử dụng rộng rãi nhất để học máy. Nếu bạn chưa cài đặt Jupyter trên máy của mình, hãy tải xuống từ đây . Để cài đặt, bạn có thể làm theo hướng dẫn trên trang web của họ để cài đặt nền tảng. Như trang web gợi ý, bạn có thể thích sử dụngAnaconda Distributionđi kèm với Python và nhiều gói Python thường được sử dụng cho tính toán khoa học và khoa học dữ liệu. Điều này sẽ làm giảm nhu cầu cài đặt các gói này riêng lẻ.
Sau khi cài đặt thành công Jupyter, hãy bắt đầu một dự án mới, màn hình của bạn ở giai đoạn này sẽ giống như sau sẵn sàng chấp nhận mã của bạn.
Bây giờ, hãy thay đổi tên của dự án từ Untitled1 to “Logistic Regression” bằng cách nhấp vào tên tiêu đề và chỉnh sửa nó.
Đầu tiên, chúng tôi sẽ nhập một số gói Python mà chúng tôi sẽ cần trong mã của mình.
Nhập các gói Python
Với mục đích này, hãy nhập hoặc cắt và dán đoạn mã sau vào trình chỉnh sửa mã -
In [1]: # import statements
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn import preprocessing
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
Của bạn Notebook sẽ trông giống như sau ở giai đoạn này:
Chạy mã bằng cách nhấp vào Runcái nút. Nếu không có lỗi nào được tạo ra, bạn đã cài đặt thành công Jupyter và hiện đã sẵn sàng cho phần còn lại của quá trình phát triển.
Ba câu lệnh nhập đầu tiên nhập các gói gấu trúc, numpy và matplotlib.pyplot trong dự án của chúng tôi. Ba câu lệnh tiếp theo nhập các mô-đun được chỉ định từ sklearn.
Nhiệm vụ tiếp theo của chúng tôi là tải xuống dữ liệu cần thiết cho dự án của chúng tôi. Chúng ta sẽ tìm hiểu điều này trong chương tiếp theo.