Học máy cơ bản sâu trong Python
Trí tuệ nhân tạo (AI) là bất kỳ mã, thuật toán hoặc kỹ thuật nào cho phép máy tính bắt chước hành vi nhận thức hoặc trí thông minh của con người. Học máy (ML) là một tập hợp con của AI sử dụng các phương pháp thống kê để cho phép máy móc học hỏi và cải thiện theo kinh nghiệm. Học sâu là một tập con của Học máy, giúp cho việc tính toán mạng nơ-ron nhiều lớp khả thi. Học máy được coi là học nông trong khi Học sâu được coi là học phân cấp với trừu tượng.
Học máy liên quan đến một loạt các khái niệm. Các khái niệm được liệt kê dưới đây -
- supervised
- unsupervised
- học tăng cường
- hồi quy tuyến tính
- hàm chi phí
- overfitting
- under-fitting
- siêu tham số, v.v.
Trong học tập có giám sát, chúng ta học cách dự đoán các giá trị từ dữ liệu được gắn nhãn. Một kỹ thuật ML giúp ích ở đây là phân loại, trong đó các giá trị đích là các giá trị rời rạc; ví dụ, mèo và chó. Một kỹ thuật khác trong học máy có thể hữu ích là hồi quy. Hồi quy hoạt động trên các giá trị mục tiêu. Các giá trị mục tiêu là các giá trị liên tục; ví dụ, dữ liệu thị trường chứng khoán có thể được phân tích bằng Regression.
Trong học tập không có giám sát, chúng tôi đưa ra suy luận từ dữ liệu đầu vào không được gắn nhãn hoặc cấu trúc. Nếu chúng ta có một triệu hồ sơ y tế và chúng ta phải hiểu rõ về nó, tìm ra cấu trúc cơ bản, các ngoại lệ hoặc phát hiện các bất thường, chúng ta sử dụng kỹ thuật phân cụm để chia dữ liệu thành các cụm rộng.
Các tập dữ liệu được chia thành các tập huấn luyện, tập thử nghiệm, tập xác nhận, v.v.
Một bước đột phá vào năm 2012 đã đưa khái niệm Học sâu trở nên nổi bật. Một thuật toán đã phân loại thành công 1 triệu hình ảnh thành 1000 loại bằng cách sử dụng 2 GPU và các công nghệ mới nhất như Dữ liệu lớn.
Liên quan đến Học sâu và Học máy truyền thống
Một trong những thách thức lớn gặp phải trong các mô hình học máy truyền thống là một quá trình được gọi là trích xuất tính năng. Người lập trình cần phải cụ thể và cho máy tính biết các tính năng cần chú ý. Những tính năng này sẽ giúp đưa ra quyết định.
Nhập dữ liệu thô vào thuật toán hiếm khi hoạt động, vì vậy trích xuất tính năng là một phần quan trọng của quy trình học máy truyền thống.
Điều này đặt ra trách nhiệm rất lớn cho người lập trình và hiệu quả của thuật toán phụ thuộc rất nhiều vào khả năng sáng tạo của người lập trình. Đối với các vấn đề phức tạp như nhận dạng đối tượng hoặc nhận dạng chữ viết tay, đây là một vấn đề rất lớn.
Học sâu, với khả năng tìm hiểu nhiều lớp biểu diễn, là một trong số ít phương pháp giúp chúng ta khai thác tính năng tự động. Các lớp dưới có thể được coi là thực hiện trích xuất tính năng tự động, yêu cầu ít hoặc không cần hướng dẫn của người lập trình.