AI - Tác nhân & Môi trường
Một hệ thống AI bao gồm một tác nhân và môi trường của nó. Các tác nhân hoạt động trong môi trường của chúng. Môi trường có thể chứa các tác nhân khác.
Tác nhân và Môi trường là gì?
An agent là bất cứ thứ gì có thể nhận thức được môi trường của nó thông qua sensors và hành động dựa trên môi trường đó thông qua effectors.
A human agent có các cơ quan cảm giác như mắt, tai, mũi, lưỡi và da song song với các cảm biến, và các cơ quan khác như tay, chân, miệng để tạo hiệu ứng.
A robotic agent thay thế máy ảnh và công cụ tìm phạm vi hồng ngoại cho cảm biến, và các động cơ và bộ truyền động khác nhau cho hiệu ứng.
A software agent có các chuỗi bit được mã hóa làm chương trình và hành động của nó.
Thuật ngữ đại lý
Performance Measure of Agent - Đó là tiêu chí, quyết định mức độ thành công của một đại lý.
Behavior of Agent - Là hành động mà tác nhân thực hiện sau bất kỳ chuỗi khái niệm nhất định nào.
Percept - Đó là đầu vào tri giác của tác nhân tại một trường hợp nhất định.
Percept Sequence - Đó là lịch sử của tất cả những gì mà một đặc vụ đã nhận ra cho đến nay.
Agent Function - Nó là một bản đồ từ trình tự giới luật đến một hành động.
Tính hợp lý
Tính hợp lý không là gì khác ngoài trạng thái hợp lý, hợp lý và có óc phán đoán tốt.
Tính hợp lý liên quan đến các hành động và kết quả mong đợi tùy thuộc vào những gì tác nhân đã nhận thức. Thực hiện các hành động với mục đích thu được thông tin hữu ích là một phần quan trọng của tính hợp lý.
Tác nhân lý tưởng là gì?
Tác nhân hợp lý lý tưởng là tác nhân có khả năng thực hiện các hành động dự kiến để tối đa hóa thước đo hiệu suất của nó, trên cơ sở -
- Trình tự nhận thức của nó
- Cơ sở kiến thức tích hợp của nó
Tính hợp lý của một tác nhân phụ thuộc vào những điều sau:
Các performance measures, yếu tố quyết định mức độ thành công.
Đặc vụ Percept Sequence cho đến bây giờ.
Của đại lý prior knowledge about the environment.
Các actions mà đại lý có thể thực hiện.
Tác nhân hợp lý luôn thực hiện hành động đúng, trong đó hành động đúng có nghĩa là hành động khiến tác nhân thành công nhất trong chuỗi nhận thức đã cho. Vấn đề mà đại lý giải quyết được đặc trưng bởi Đo hiệu suất, Môi trường, Thiết bị truyền động và Cảm biến (PEAS).
Cấu trúc của các tác nhân thông minh
Cấu trúc của Agent có thể được xem như:
- Agent = Architecture + Agent Program
- Architecture = máy móc mà một tác nhân thực thi.
- Chương trình đại lý = triển khai một chức năng đại lý.
Tác nhân phản xạ đơn giản
- Họ chọn hành động chỉ dựa trên nhận thức hiện tại.
- Chúng chỉ hợp lý nếu một quyết định chính xác chỉ được đưa ra trên cơ sở giới luật hiện hành.
- Môi trường của chúng hoàn toàn có thể quan sát được.
Condition-Action Rule - Nó là một quy tắc ánh xạ một trạng thái (điều kiện) đến một hành động.
Tác nhân phản xạ dựa trên mô hình
Họ sử dụng một mô hình của thế giới để lựa chọn hành động của họ. Chúng duy trì trạng thái bên trong.
Model - kiến thức về “cách mọi thứ xảy ra trên thế giới”.
Internal State - Nó là một đại diện của các khía cạnh không được quan sát của trạng thái hiện tại tùy thuộc vào lịch sử cảm nhận.
Updating the state requires the information about −
- Thế giới phát triển như thế nào.
- Hành động của đại lý ảnh hưởng đến thế giới như thế nào.
Tác nhân dựa trên mục tiêu
Họ lựa chọn các hành động để đạt được mục tiêu. Phương pháp tiếp cận dựa trên mục tiêu linh hoạt hơn phương pháp phản xạ vì kiến thức hỗ trợ một quyết định được mô hình hóa rõ ràng, do đó cho phép sửa đổi.
Goal - Đó là sự mô tả các tình huống mong muốn.
Đại lý dựa trên tiện ích
Họ chọn các hành động dựa trên sở thích (tiện ích) cho mỗi trạng thái.
Mục tiêu không đủ khi -
Có những mục tiêu mâu thuẫn nhau, trong số đó chỉ có thể đạt được một số mục tiêu.
Mục tiêu có một số điều không chắc chắn trong việc đạt được và bạn cần cân nhắc khả năng thành công với tầm quan trọng của mục tiêu.
Bản chất của Môi trường
Một số chương trình hoạt động trong artificial environment được giới hạn ở đầu vào bàn phím, cơ sở dữ liệu, hệ thống tệp máy tính và đầu ra ký tự trên màn hình.
Ngược lại, một số tác nhân phần mềm (robot phần mềm hoặc softbots) tồn tại trong các miền softbots phong phú, không giới hạn. Trình mô phỏng có mộtvery detailed, complex environment. Tác nhân phần mềm cần chọn từ một loạt các hành động trong thời gian thực. Một softbot được thiết kế để quét các sở thích trực tuyến của khách hàng và hiển thị các mặt hàng thú vị cho khách hàng hoạt động trongreal cũng như một artificial Môi trường.
Nổi tiếng nhất artificial environment là Turing Test environment, trong đó một tác nhân thực và tác nhân nhân tạo khác được thử nghiệm trên mặt bằng bình đẳng. Đây là một môi trường rất thách thức vì rất khó cho một tác nhân phần mềm cũng như con người.
Kiểm tra Turing
Thành công của một hành vi thông minh của một hệ thống có thể được đo lường bằng Kiểm tra Turing.
Hai người và một máy được đánh giá tham gia thử nghiệm. Trong số hai người, một người đóng vai trò người thử nghiệm. Mỗi người trong số họ ngồi trong các phòng khác nhau. Người thử nghiệm không biết ai là máy và ai là người. Anh ta thẩm vấn các câu hỏi bằng cách nhập và gửi chúng đến cả hai bộ phận thông minh, nơi anh ta nhận được câu trả lời đã đánh máy.
Thử nghiệm này nhằm mục đích đánh lừa người thử nghiệm. Nếu người kiểm tra không xác định được phản ứng của máy từ phản ứng của con người, thì máy được coi là thông minh.
Thuộc tính của môi trường
Môi trường có nhiều thuộc tính -
Discrete / Continuous- Nếu có một số hạn chế các trạng thái riêng biệt, xác định rõ ràng, thì môi trường là rời rạc (Ví dụ: cờ vua); nếu không thì nó là liên tục (Ví dụ: lái xe).
Observable / Partially Observable- Nếu có thể xác định được trạng thái hoàn chỉnh của môi trường tại mỗi thời điểm từ các khái niệm có thể quan sát được; nếu không thì nó chỉ có thể quan sát được một phần.
Static / Dynamic- Nếu môi trường không thay đổi trong khi một tác nhân đang hoạt động, thì nó là tĩnh; nếu không thì nó là động.
Single agent / Multiple agents - Môi trường có thể chứa các tác nhân khác có thể cùng loại hoặc khác loại với tác nhân.
Accessible / Inaccessible - Nếu bộ máy cảm quan của tác nhân có thể tiếp cận được trạng thái hoàn chỉnh của môi trường thì tác nhân đó có thể tiếp cận được môi trường.
Deterministic / Non-deterministic- Nếu trạng thái tiếp theo của môi trường được xác định hoàn toàn bởi trạng thái hiện tại và các hành động của tác nhân, thì môi trường là xác định; nếu không nó là không xác định.
Episodic / Non-episodic- Trong môi trường nhiều tập, mỗi tập bao gồm tác nhân nhận thức và sau đó hành động. Chất lượng của hành động của nó chỉ phụ thuộc vào chính tập phim. Các tập tiếp theo không phụ thuộc vào các hành động trong các tập trước. Môi trường Episodic đơn giản hơn nhiều vì tác nhân không cần phải suy nghĩ trước.