Mạng thần kinh nhân tạo - Khối xây dựng
Việc xử lý ANN phụ thuộc vào ba khối xây dựng sau:
- Cấu trúc mạng
- Điều chỉnh trọng lượng hoặc học tập
- Chức năng kích hoạt
Trong chương này, chúng tôi sẽ thảo luận chi tiết về ba khối xây dựng này của ANN
Cấu trúc mạng
Cấu trúc liên kết mạng là sự sắp xếp của một mạng cùng với các nút và đường kết nối của nó. Theo cấu trúc liên kết, ANN có thể được phân loại thành các loại sau:
Mạng chuyển tiếp
Nó là một mạng không lặp lại có các đơn vị / nút xử lý trong các lớp và tất cả các nút trong một lớp được kết nối với các nút của các lớp trước đó. Kết nối có trọng lượng khác nhau đối với chúng. Không có vòng phản hồi có nghĩa là tín hiệu chỉ có thể truyền theo một hướng, từ đầu vào đến đầu ra. Nó có thể được chia thành hai loại sau:
Single layer feedforward network- Khái niệm về ANN truyền tiếp chỉ có một lớp trọng số. Nói cách khác, chúng ta có thể nói lớp đầu vào được kết nối hoàn toàn với lớp đầu ra.
Multilayer feedforward network- Khái niệm ANN truyền thẳng có nhiều hơn một lớp có trọng số. Vì mạng này có một hoặc nhiều lớp giữa đầu vào và lớp đầu ra, nó được gọi là các lớp ẩn.
Mạng phản hồi
Như tên cho thấy, mạng phản hồi có các đường phản hồi, có nghĩa là tín hiệu có thể truyền theo cả hai hướng bằng cách sử dụng các vòng lặp. Điều này làm cho nó trở thành một hệ động lực phi tuyến tính, thay đổi liên tục cho đến khi nó đạt trạng thái cân bằng. Nó có thể được chia thành các loại sau:
Recurrent networks- Chúng là mạng phản hồi với các vòng khép kín. Sau đây là hai loại mạng lặp lại.
Fully recurrent network - Nó là kiến trúc mạng nơ ron đơn giản nhất vì tất cả các nút được kết nối với tất cả các nút khác và mỗi nút hoạt động như cả đầu vào và đầu ra.
Jordan network - Là một mạng vòng kín, trong đó đầu ra sẽ chuyển đến đầu vào một lần nữa dưới dạng phản hồi như trong sơ đồ sau.
Điều chỉnh trọng lượng hoặc học tập
Học, trong mạng nơ-ron nhân tạo, là phương pháp điều chỉnh trọng số của các kết nối giữa các nơ-ron của một mạng cụ thể. Học trong ANN có thể được phân thành ba loại cụ thể là học có giám sát, học không giám sát và học tăng cường.
Học tập có giám sát
Như tên cho thấy, loại hình học tập này được thực hiện dưới sự giám sát của một giáo viên. Quá trình học tập này là phụ thuộc.
Trong quá trình đào tạo ANN theo phương pháp học có giám sát, vectơ đầu vào được trình bày cho mạng, vectơ này sẽ đưa ra một vectơ đầu ra. Vectơ đầu ra này được so sánh với vectơ đầu ra mong muốn. Một tín hiệu lỗi được tạo ra, nếu có sự khác biệt giữa đầu ra thực tế và vector đầu ra mong muốn. Trên cơ sở tín hiệu lỗi này, các trọng số được điều chỉnh cho đến khi kết quả đầu ra thực tế khớp với đầu ra mong muốn.
Học tập không giám sát
Như tên cho thấy, loại hình học tập này được thực hiện mà không có sự giám sát của giáo viên. Quá trình học tập này là độc lập.
Trong quá trình đào tạo ANN dưới sự học tập không giám sát, các vectơ đầu vào cùng loại được kết hợp để tạo thành các cụm. Khi một mẫu đầu vào mới được áp dụng, thì mạng nơ ron sẽ đưa ra phản hồi đầu ra cho biết lớp mà mẫu đầu vào thuộc về.
Không có phản hồi từ môi trường về những gì nên là đầu ra mong muốn và nếu nó là chính xác hoặc không chính xác. Do đó, trong kiểu học tập này, bản thân mạng phải khám phá ra các mẫu và tính năng từ dữ liệu đầu vào và mối quan hệ giữa dữ liệu đầu vào với đầu ra.
Học tăng cường
Như tên cho thấy, kiểu học này được sử dụng để củng cố hoặc tăng cường mạng lưới qua một số thông tin phê bình. Quá trình học tập này tương tự như học tập có giám sát, tuy nhiên chúng ta có thể có rất ít thông tin.
Trong quá trình đào tạo mạng theo học tăng cường, mạng nhận được một số phản hồi từ môi trường. Điều này làm cho nó tương tự như học có giám sát. Tuy nhiên, phản hồi thu được ở đây là đánh giá không mang tính hướng dẫn, có nghĩa là không có giáo viên như trong học tập có giám sát. Sau khi nhận được phản hồi, mạng thực hiện điều chỉnh trọng số để có được thông tin phê bình tốt hơn trong tương lai.
Chức năng kích hoạt
Nó có thể được định nghĩa là lực hoặc nỗ lực bổ sung tác dụng lên đầu vào để có được đầu ra chính xác. Trong ANN, chúng tôi cũng có thể áp dụng các hàm kích hoạt trên đầu vào để có được đầu ra chính xác. Tiếp theo là một số chức năng kích hoạt được quan tâm -
Chức năng kích hoạt tuyến tính
Nó còn được gọi là hàm nhận dạng vì nó không thực hiện chỉnh sửa đầu vào. Nó có thể được định nghĩa là -
$$ F (x) \: = \: x $$
Chức năng kích hoạt Sigmoid
Nó có hai loại như sau:
Binary sigmoidal function- Chức năng kích hoạt này thực hiện chỉnh sửa đầu vào từ 0 đến 1. Bản chất là tích cực. Nó luôn có giới hạn, có nghĩa là đầu ra của nó không được nhỏ hơn 0 và lớn hơn 1. Về bản chất, nó cũng đang tăng lên một cách nghiêm ngặt, có nghĩa là càng nhiều đầu vào cao hơn sẽ là đầu ra. Nó có thể được định nghĩa là
$$ F (x) \: = \: sigm (x) \: = \: \ frac {1} {1 \: + \: exp (-x)} $$
Bipolar sigmoidal function- Chức năng kích hoạt này thực hiện chỉnh sửa đầu vào giữa -1 và 1. Nó có thể là tích cực hoặc tiêu cực về bản chất. Nó luôn có giới hạn, có nghĩa là đầu ra của nó không thể nhỏ hơn -1 và nhiều hơn 1. Nó cũng đang tăng dần về bản chất giống như hàm sigmoid. Nó có thể được định nghĩa là
$$ F (x) \: = \: sigm (x) \: = \: \ frac {2} {1 \: + \: exp (-x)} \: - \: 1 \: = \: \ frac {1 \: - \: exp (x)} {1 \: + \: exp (x)} $$