Caffe2 - Tổng quan

Bây giờ, khi bạn đã có một số hiểu biết về học sâu, hãy để chúng tôi tìm hiểu tổng quan về Caffe là gì.

Đào tạo CNN

Hãy cùng chúng tôi tìm hiểu quy trình đào tạo CNN để phân loại hình ảnh. Quy trình bao gồm các bước sau:

  • Data Preparation- Trong bước này, chúng tôi cắt giữa các hình ảnh và thay đổi kích thước của chúng để tất cả các hình ảnh để đào tạo và thử nghiệm sẽ có cùng kích thước. Điều này thường được thực hiện bằng cách chạy một tập lệnh Python nhỏ trên dữ liệu hình ảnh.

  • Model Definition- Trong bước này, chúng tôi xác định một kiến ​​trúc CNN. Cấu hình được lưu trữ trong.pb (protobuf)tập tin. Một kiến ​​trúc CNN điển hình được thể hiện trong hình bên dưới.

  • Solver Definition- Chúng tôi xác định tệp cấu hình bộ giải. Solver thực hiện tối ưu hóa mô hình.

  • Model Training- Chúng tôi sử dụng tiện ích Caffe có sẵn để huấn luyện người mẫu. Việc đào tạo có thể mất một lượng thời gian và mức sử dụng CPU đáng kể. Sau khi hoàn thành khóa đào tạo, Caffe lưu trữ mô hình trong một tệp, tệp này sau này có thể được sử dụng trên dữ liệu thử nghiệm và triển khai cuối cùng cho các dự đoán.

Có gì mới trong Caffe2

Trong Caffe2, bạn sẽ tìm thấy nhiều mô hình được đào tạo trước sẵn sàng sử dụng và cũng thường xuyên tận dụng sự đóng góp của cộng đồng cho các mô hình và thuật toán mới. Các mô hình mà bạn tạo có thể dễ dàng mở rộng quy mô bằng cách sử dụng sức mạnh GPU trên đám mây và cũng có thể được đưa xuống sử dụng hàng loạt trên thiết bị di động với các thư viện đa nền tảng của nó.

Những cải tiến được thực hiện trong Caffe2 so với Caffe có thể được tóm tắt như sau:

  • Triển khai di động
  • Hỗ trợ phần cứng mới
  • Hỗ trợ đào tạo phân tán quy mô lớn
  • Tính toán lượng tử hóa
  • Stress test trên Facebook

Demo mô hình tiền chế

Trang web Trung tâm Học tập và Tầm nhìn Berkeley (BVLC) cung cấp các bản demo về mạng lưới được đào tạo trước của họ. Một mạng như vậy để phân loại hình ảnh có sẵn trên liên kết được nêu trong đâyhttps://caffe2.ai/docs/learn-more#null__caffe-neural-network-for-image-classification và được mô tả trong ảnh chụp màn hình bên dưới.

Trong ảnh chụp màn hình, hình ảnh một con chó được phân loại và gắn nhãn với độ chính xác dự đoán của nó. Nó cũng nói rằng nó chỉ mất0.068 secondsđể phân loại hình ảnh. Bạn có thể thử một hình ảnh do chính mình lựa chọn bằng cách chỉ định URL của hình ảnh hoặc tải lên chính hình ảnh đó trong các tùy chọn được đưa ra ở cuối màn hình.