Trí tuệ nhân tạo - Mạng thần kinh
Tuy nhiên, một lĩnh vực nghiên cứu khác trong AI, mạng lưới thần kinh, được lấy cảm hứng từ mạng lưới thần kinh tự nhiên của hệ thần kinh con người.
Mạng thần kinh nhân tạo (ANN) là gì?
Người phát minh ra máy tính thần kinh đầu tiên, Tiến sĩ Robert Hecht-Nielsen, định nghĩa một mạng lưới thần kinh là -
"... một hệ thống máy tính được tạo thành từ một số phần tử xử lý đơn giản, có tính kết nối cao, xử lý thông tin bằng phản ứng trạng thái động của chúng với các đầu vào bên ngoài."
Cấu trúc cơ bản của ANN
Ý tưởng của ANN dựa trên niềm tin rằng hoạt động của bộ não con người bằng cách tạo ra các kết nối phù hợp, có thể được bắt chước bằng cách sử dụng silicon và dây điện như cuộc sống neurons và dendrites.
Bộ não con người bao gồm 86 tỷ tế bào thần kinh được gọi là neurons. Chúng được kết nối với hàng nghìn ô khác bằng Axons.Các kích thích từ môi trường bên ngoài hoặc đầu vào từ các cơ quan cảm giác được các đuôi gai chấp nhận. Các đầu vào này tạo ra các xung điện, truyền nhanh qua mạng nơ-ron. Sau đó, một tế bào thần kinh có thể gửi thông điệp đến tế bào thần kinh khác để xử lý sự cố hoặc không gửi đi.
ANN bao gồm nhiều nodes, bắt chước sinh học neuronscủa bộ não con người. Các tế bào thần kinh được kết nối bằng các liên kết và chúng tương tác với nhau. Các nút có thể lấy dữ liệu đầu vào và thực hiện các thao tác đơn giản trên dữ liệu. Kết quả của các hoạt động này được chuyển cho các tế bào thần kinh khác. Đầu ra tại mỗi nút được gọi làactivation hoặc là node value.
Mỗi liên kết được liên kết với weight.ANN có khả năng học hỏi, diễn ra bằng cách thay đổi các giá trị trọng lượng. Hình minh họa sau đây cho thấy một ANN đơn giản -
Các loại mạng thần kinh nhân tạo
Có hai cấu trúc liên kết Mạng thần kinh Nhân tạo - FeedForward và Feedback.
FeedForward ANN
Trong ANN này, luồng thông tin là một chiều. Một đơn vị gửi thông tin cho đơn vị khác mà từ đó nó không nhận được bất kỳ thông tin nào. Không có vòng lặp phản hồi. Chúng được sử dụng trong tạo / nhận dạng / phân loại mẫu. Họ có đầu vào và đầu ra cố định.
FeedBack ANN
Ở đây, các vòng phản hồi được cho phép. Chúng được sử dụng trong các bộ nhớ có thể giải quyết nội dung.
Hoạt động của ANN
Trong các sơ đồ cấu trúc liên kết được hiển thị, mỗi mũi tên thể hiện kết nối giữa hai nơ-ron và chỉ ra đường dẫn dòng thông tin. Mỗi kết nối có một trọng số, một số nguyên điều khiển tín hiệu giữa hai nơ-ron.
Nếu mạng tạo ra đầu ra “tốt hoặc mong muốn” thì không cần điều chỉnh trọng số. Tuy nhiên, nếu mạng tạo ra đầu ra “kém hoặc không mong muốn” hoặc lỗi, thì hệ thống sẽ thay đổi trọng số để cải thiện kết quả tiếp theo.
Học máy trong ANN
ANN có khả năng học hỏi và họ cần được đào tạo. Có một số chiến lược học tập -
Supervised Learning- Nó liên quan đến một giáo viên uyên bác hơn chính ANN. Ví dụ: giáo viên cung cấp một số dữ liệu ví dụ mà giáo viên đã biết câu trả lời.
Ví dụ, nhận dạng mẫu. ANN đưa ra các phỏng đoán trong khi nhận dạng. Sau đó, giáo viên cung cấp ANN với các câu trả lời. Sau đó, mạng lưới sẽ so sánh kết quả đoán với câu trả lời “đúng” của giáo viên và thực hiện điều chỉnh theo lỗi.
Unsupervised Learning- Nó được yêu cầu khi không có tập dữ liệu ví dụ với các câu trả lời đã biết. Ví dụ: tìm kiếm một mẫu ẩn. Trong trường hợp này, phân cụm tức là chia một tập hợp các phần tử thành các nhóm theo một số mẫu chưa biết được thực hiện dựa trên các tập dữ liệu hiện có.
Reinforcement Learning- Chiến lược này được xây dựng dựa trên sự quan sát. ANN đưa ra quyết định bằng cách quan sát môi trường của nó. Nếu quan sát là tiêu cực, mạng sẽ điều chỉnh trọng số của nó để có thể đưa ra quyết định cần thiết khác vào lần sau.
Thuật toán lan truyền ngược
Nó là thuật toán đào tạo hoặc học tập. Nó học bằng ví dụ. Nếu bạn gửi cho thuật toán ví dụ về những gì bạn muốn mạng thực hiện, nó sẽ thay đổi trọng số của mạng để nó có thể tạo ra đầu ra mong muốn cho một đầu vào cụ thể khi kết thúc khóa đào tạo.
Mạng lan truyền ngược lý tưởng cho các tác vụ nhận dạng và ánh xạ mẫu đơn giản.
Bayesian Networks (BN)
Đây là những cấu trúc đồ họa được sử dụng để biểu diễn mối quan hệ xác suất giữa một tập hợp các biến ngẫu nhiên. Mạng Bayes còn được gọi làBelief Networks hoặc là Bayes Nets. BN lý do về miền không chắc chắn.
Trong các mạng này, mỗi nút đại diện cho một biến ngẫu nhiên với các mệnh đề cụ thể. Ví dụ, trong lĩnh vực chẩn đoán y tế, nút Ung thư đại diện cho đề xuất rằng một bệnh nhân bị ung thư.
Các cạnh kết nối các nút biểu thị sự phụ thuộc xác suất giữa các biến ngẫu nhiên đó. Nếu trong số hai nút, một nút đang ảnh hưởng đến nút kia thì chúng phải được kết nối trực tiếp theo các hướng của hiệu ứng. Độ mạnh của mối quan hệ giữa các biến được định lượng bằng xác suất liên quan đến mỗi nút.
Có một hạn chế duy nhất đối với các cung trong BN là bạn không thể quay lại một nút chỉ đơn giản bằng cách đi theo các cung có hướng. Do đó, các BN được gọi là Đồ thị vòng có hướng (DAG).
BN có khả năng xử lý đồng thời các biến đa giá trị. Các biến BN bao gồm hai thứ nguyên -
- Phạm vi giới từ
- Xác suất gán cho mỗi giới từ.
Xét tập hữu hạn X = {X 1 , X 2 ,…, X n } gồm các biến ngẫu nhiên rời rạc, trong đó mỗi biến X i có thể nhận các giá trị từ một tập hữu hạn, ký hiệu là Val (X i ). Nếu có một liên kết có hướng từ biến X i đến biến X j , thì biến X i sẽ là cha của biến X j thể hiện sự phụ thuộc trực tiếp giữa các biến.
Cấu trúc của BN là lý tưởng để kết hợp kiến thức trước đây và dữ liệu quan sát. BN có thể được sử dụng để tìm hiểu các mối quan hệ nhân quả và hiểu các lĩnh vực vấn đề khác nhau và để dự đoán các sự kiện trong tương lai, ngay cả trong trường hợp thiếu dữ liệu.
Xây dựng mạng Bayes
Một kỹ sư kiến thức có thể xây dựng một mạng Bayes. Có một số bước mà kỹ sư kiến thức cần thực hiện trong khi xây dựng nó.
Example problem- Bệnh ung thư phổi. Một bệnh nhân đã bị khó thở. Anh đi khám, bác sĩ nghi ngờ mình bị ung thư phổi. Bác sĩ biết rằng ngoài ung thư phổi, bệnh nhân có thể mắc nhiều bệnh khác như bệnh lao và viêm phế quản.
Gather Relevant Information of Problem
- Bệnh nhân có phải là người hút thuốc lá không? Nếu có thì khả năng cao bị ung thư và viêm phế quản.
- Bệnh nhân có tiếp xúc với không khí ô nhiễm không? Nếu có, loại ô nhiễm không khí nào?
- Chụp X-quang dương tính với X-quang sẽ cho biết bệnh lao hoặc ung thư phổi.
Identify Interesting Variables
Kỹ sư kiến thức cố gắng trả lời các câu hỏi -
- Những nút nào để đại diện?
- Những giá trị nào họ có thể nhận? Họ có thể ở trạng thái nào?
Bây giờ chúng ta hãy xem xét các nút, chỉ với các giá trị rời rạc. Biến phải nhận chính xác một trong các giá trị này tại một thời điểm.
Common types of discrete nodes are -
Boolean nodes - Chúng đại diện cho các mệnh đề, nhận các giá trị nhị phân TRUE (T) và FALSE (F).
Ordered values- Một nút Ô nhiễm có thể đại diện và lấy các giá trị từ {thấp, trung bình, cao} mô tả mức độ tiếp xúc với ô nhiễm của bệnh nhân.
Integral values- Một nút được gọi là Tuổi có thể đại diện cho tuổi của bệnh nhân với các giá trị có thể từ 1 đến 120. Ngay cả ở giai đoạn đầu này, các lựa chọn mô hình hóa đang được thực hiện.
Các nút và giá trị có thể có cho ví dụ ung thư phổi -
Tên nút | Kiểu | Giá trị | Tạo nút |
---|---|---|---|
Thận trọng | Nhị phân | {THẤP, CAO, TRUNG BÌNH} |
|
Người hút thuốc | Boolean | {TRUE, FASLE} | |
Ung thư phổi | Boolean | {TRUE, FASLE} | |
Tia X | Nhị phân | {Tích cực, Tiêu cực} |
Create Arcs between Nodes
Cấu trúc liên kết của mạng nên nắm bắt các mối quan hệ định tính giữa các biến.
Ví dụ, nguyên nhân nào khiến một bệnh nhân bị ung thư phổi? - Ô nhiễm và hút thuốc lá. Sau đó, thêm các vòng cung từ nút Ô nhiễm và nút Người hút thuốc đến nút Ung thư phổi.
Tương tự nếu bệnh nhân bị ung thư phổi thì kết quả chụp X-quang sẽ dương tính. Sau đó, thêm các vòng cung từ nút Ung thư phổi đến nút X-Ray.
Specify Topology
Thông thường, BN được bố trí sao cho các vòng cung hướng từ trên xuống dưới. Tập hợp các nút cha của một nút X được cung cấp bởi Cha mẹ (X).
Các Lung-Ung thư nút có hai cha mẹ (lý do hoặc nguyên nhân): Ô nhiễm và Smoker , trong khi nút Smoker là mộtancestorcủa nút X-Ray . Tương tự, X-Ray là con (hậu quả hoặc ảnh hưởng) của ung thư phổi nút vàsuccessorcủa các nút Hút thuốc và Ô nhiễm.
Conditional Probabilities
Bây giờ định lượng các mối quan hệ giữa các nút được kết nối: điều này được thực hiện bằng cách chỉ định phân phối xác suất có điều kiện cho mỗi nút. Vì chỉ các biến rời rạc được xem xét ở đây, điều này có dạngConditional Probability Table (CPT).
Đầu tiên, đối với mỗi nút, chúng ta cần xem xét tất cả các tổ hợp giá trị có thể có của các nút cha đó. Mỗi kết hợp như vậy được gọi làinstantiationcủa tập hợp mẹ. Đối với mỗi lần khởi tạo khác biệt của các giá trị nút cha, chúng ta cần xác định xác suất mà nút con sẽ nhận.
Ví dụ, cha mẹ của nút Ung thư phổi là Ô nhiễm và Hút thuốc. Chúng nhận các giá trị có thể có = {(H, T), (H, F), (L, T), (L, F)}. CPT chỉ định xác suất ung thư cho từng trường hợp này lần lượt là <0,05, 0,02, 0,03, 0,001>.
Mỗi nút sẽ có xác suất có điều kiện được liên kết như sau:
Các ứng dụng của mạng thần kinh
Họ có thể thực hiện các nhiệm vụ dễ dàng đối với con người nhưng khó đối với máy móc -
Aerospace - Lái máy bay tự động, phát hiện lỗi máy bay.
Automotive - Hệ thống hướng dẫn ô tô.
Military - Định hướng và lái vũ khí, theo dõi mục tiêu, phân biệt đối tượng, nhận dạng khuôn mặt, nhận dạng tín hiệu / hình ảnh.
Electronics - Dự đoán trình tự mã, bố trí chip IC, phân tích lỗi chip, thị giác máy, tổng hợp giọng nói.
Financial - Thẩm định bất động sản, cố vấn khoản vay, sàng lọc thế chấp, xếp hạng trái phiếu doanh nghiệp, chương trình giao dịch danh mục đầu tư, phân tích tài chính doanh nghiệp, dự đoán giá trị tiền tệ, trình đọc tài liệu, đánh giá hồ sơ tín dụng.
Industrial - Kiểm soát quá trình sản xuất, thiết kế và phân tích sản phẩm, hệ thống kiểm tra chất lượng, phân tích chất lượng hàn, dự đoán chất lượng giấy, phân tích thiết kế sản phẩm hóa chất, mô hình hóa động lực của hệ thống quy trình hóa chất, phân tích bảo trì máy, đấu thầu dự án, lập kế hoạch và quản lý.
Medical - Phân tích tế bào ung thư, phân tích điện não đồ và điện tâm đồ, thiết kế bộ phận giả, bộ tối ưu hóa thời gian cấy ghép.
Speech - Nhận dạng giọng nói, phân loại giọng nói, chuyển văn bản sang giọng nói.
Telecommunications - Nén hình ảnh và dữ liệu, dịch vụ thông tin tự động, dịch ngôn ngữ nói theo thời gian thực.
Transportation - Hệ thống chẩn đoán phanh xe tải, lập lịch trình xe, hệ thống định tuyến.
Software - Nhận dạng mẫu trong nhận dạng khuôn mặt, nhận dạng ký tự quang học, v.v.
Time Series Prediction - ANN được sử dụng để đưa ra dự đoán về trữ lượng và thiên tai.
Signal Processing - Mạng nơron có thể được đào tạo để xử lý tín hiệu âm thanh và lọc tín hiệu đó một cách thích hợp trong máy trợ thính.
Control - ANN thường được sử dụng để đưa ra quyết định lái của các phương tiện vật lý.
Anomaly Detection - Vì ANN là chuyên gia trong việc nhận dạng các mẫu, họ cũng có thể được đào tạo để tạo ra kết quả đầu ra khi có điều gì đó bất thường xảy ra làm sai mẫu.