Mạng lưới thần kinh cho tất cả
Tôi đã phải mất một thời gian dài để huấn luyện mạng lưới thần kinh đầu tiên của mình tại một hội chợ khoa học lớp 6. Gia đình tôi sống ở vùng nông thôn phía Bắc California đầy cây sồi, gỗ đỏ và các loài thực vật bản địa khác. Đối với hội chợ khoa học sắp tới, con trai tôi quyết định xây dựng một mô hình học máy để xác định các loại cây ở địa phương. Chúng tôi đi bộ đường dài vào chiều thứ Bảy để chụp ảnh và xây dựng bộ dữ liệu, trong khi vào tối thứ Bảy, chúng tôi làm việc trên một mô hình mạng thần kinh. Hội chợ khoa học sẽ diễn ra trong hai tháng nữa và tôi nghĩ rằng chúng tôi sẽ cần thời gian đó để xây dựng một mô hình phù hợp. Hóa ra, tôi đã đánh giá quá thấp việc học máy đã trở nên dễ dàng và dễ tiếp cận như thế nào. Phiên bản 1 hoàn thành chỉ sau vài giờ với độ chính xác đáng ngạc nhiên. Chúng tôi đã sử dụng cùng một công cụ AI mạnh mẽ như nhiều phòng thí nghiệm nghiên cứu AI hàng đầu. Chúng tôi đã làm mọi thứ trên một trình duyệt và nó hoàn toàn miễn phí.
Lần đầu tiên tôi bắt gặp mạng lưới thần kinh trong một khóa học đại học về AI trong cái gọi là mùa đông AI vào cuối những năm 90. Đây là điểm thấp của sự nhiệt tình đối với AI nói chung và mạng lưới thần kinh nói riêng. Bất chấp những tiến bộ lý thuyết trong những năm 80, khả năng ứng dụng thương mại còn hạn chế và tương đối ít phòng thí nghiệm nghiên cứu tập trung vào mạng lưới thần kinh. Tuy nhiên, tôi vẫn bị hấp dẫn bởi các cách tiếp cận sinh học đối với AI và tôi đã thử nghiệm các cách tiếp cận và ứng dụng đào tạo khác nhau. Tôi đã xây dựng các mô hình mạng lưới thần kinh và mã hóa các thuật toán đào tạo hầu hết từ đầu bằng ngôn ngữ lập trìnhngôn ngữ lập trình. Việc đào tạo có thể mất hàng giờ và không có nhiều dữ liệu đào tạo. Trong một thời gian, tôi đã tham gia phòng thí nghiệm AI tại UC San Diego để khám phá thêm về mạng lưới thần kinh, nhưng cuối cùng tôi đã tiếp tục. Phải mất 15 năm nữa mạng lưới thần kinh mới thực sự phát triển và thuật ngữ “ học sâu ” được sử dụng rộng rãi.
Trong khoảng một thập kỷ qua, mạng nơ-ron đã bước vào thời kỳ phục hưng mới được hỗ trợ bởi GPU, điện toán đám mây, tập dữ liệu lớn và những tiến bộ liên tục trong thuật toán học tập. Các ứng dụng thương mại đã bùng nổ. Các ứng dụng bao gồm nhận dạng giọng nói (Siri, Alexa), dịch thuật (Google Dịch), tạo văn bản (OpenAI's GPT-3), nhận dạng hình ảnh (Tesla Autopilot, Adobe Sensei), tạo hình ảnh (Dall-E 2, Midjourney, Stable Diffusion), khuôn mặt nhận dạng (Apple Photos), tạo video (Runway) và khám phá thuốc. Một số ứng dụng mới ấn tượng nhất là trong AI tổng quát , đang phát triển với tốc độ chóng mặt.
Chuyển nhanh đến cuối tuần lễ tạ ơn vừa qua, điều này đã thúc đẩy một số quan sát.
Đầu tiên, thật dễ dàng để thiết lập và đào tạo ngay cả các mô hình học máy khá phức tạp. Bạn không cần phải viết mã hoặc có kiến thức cơ bản về máy học. Có nhiều công cụ học máy không cần mã và AutoML tự động hóa các bước phổ biến trong quy trình học máy. Để kết hợp các quy trình công việc của riêng bạn, bạn nên có kiến thức cơ bản về python, một ngôn ngữ phổ biến trong cộng đồng máy học. Con trai 12 tuổi của tôi đã học trăn được khoảng hai năm. Theo sáng kiến của riêng mình, anh ấy đã tải xuống TensorFlow — thư viện máy học hỗ trợ Google và OpenAI — và nhanh chóng có một mô hình mẫu chạy trên máy tính xách tay của mình. Thậm chí dễ dàng hơn thế, tôi tìm thấy một hướng dẫnvề phân loại hình ảnh sử dụng TensorFlow và chạy trên môi trường Colab của Google . Colab cho phép bạn xây dựng các mô hình máy học trong trình duyệt web và thực thi chúng trên GPU của Google miễn phí mà không cần tải xuống hay cài đặt bất kỳ gói nào. Có vô số hướng dẫn và mô hình được đào tạo trước để bắt đầu.
Thứ hai, các yếu tố giới hạn tốc độ triển khai công nghệ này là trí tưởng tượng cho các ứng dụng mới trong thế giới thực và dữ liệu chất lượng để huấn luyện các mô hình. Vấn đề nhận dạng một loại cây dựa trên một hình ảnh thuộc lĩnh vực phân loại hình ảnh. Vì đây là một ứng dụng phổ biến của máy học nên bước thử thách nhất là tập hợp một tập dữ liệu mạnh mẽ. Chúng tôi không thể tìm thấy bộ dữ liệu có sẵn về các cây địa phương được gắn tên nên chúng tôi đã tạo bộ dữ liệu của riêng mình. Một chuyến đi bộ ngắn với một chiếc iphone mang lại khoảng 250 hình ảnh. Điều này là rất nhỏ theo tiêu chuẩn ngày nay. Mô hình Khuếch tán ổn định mới nhất được đào tạo bằng cách sử dụng bộ dữ liệu LAION-5B được phát hành gần đây gồm 5,85 tỷ hình ảnh từ web. Khi nhiều bộ dữ liệu được công khai, các rào cản đối với việc phát triển các mô hình có mục đích đặc biệt sẽ giảm xuống.
Thứ ba, hiện nay có rất nhiều giải pháp và nguồn lực để đưa các mô hình máy học vào sản xuất (ML Ops). Chỉ vài năm trước, việc đào tạo một mô hình và triển khai nó ở tốc độ và quy mô web là một thách thức. Ngày nay, việc triển khai các mô hình trong trình duyệt, trên điện thoại, trên máy chủ hoặc trong quy trình làm việc của Doanh nghiệp là tương đối đơn giản.
Chúng ta đã bước vào thời kỳ hoàng kim của mạng lưới thần kinh. Đây là khoảng thời gian cực kỳ thú vị để trở thành một nhà nghiên cứu AI/học sâu, một doanh nhân AI hoặc một sinh viên quan tâm đến AI. Hiện đã có những ứng dụng trưởng thành và một hệ thống nghiên cứu AI mới nổi sẽ cung cấp năng lượng cho các ứng dụng đổi mới trong nhiều năm tới. Khả năng tiếp cận của công nghệ có nghĩa là bạn không cần phòng thí nghiệm nghiên cứu hoặc vốn để tham gia. Thật đáng kinh ngạc khi một khái niệm có thể tồn tại trong nhiều thập kỷ (ví dụ: ô tô điện, mạng lưới thần kinh) nhưng không cất cánh cho đến khi có điều kiện phù hợp.

![Dù sao thì một danh sách được liên kết là gì? [Phần 1]](https://post.nghiatu.com/assets/images/m/max/724/1*Xokk6XOjWyIGCBujkJsCzQ.jpeg)



































