Tình thế tiến thoái lưỡng nan của tù nhân

May 27 2008
Tình trạng khó xử của tù nhân là một ví dụ về lý thuyết trò chơi phổ biến thể hiện các nguyên tắc như sở thích. Tìm hiểu về tình thế tiến thoái lưỡng nan của tù nhân và xem ma trận lý thuyết trò chơi.

Một trong những cách tốt nhất để hiểu một số nguyên tắc lý thuyết trò chơi cơ bản là xem xét một ví dụ lý thuyết trò chơi cổ điển: tình thế tiến thoái lưỡng nan của tù nhân . Trò chơi này kiểm tra cách hai người chơi tương tác dựa trên sự hiểu biết về động cơ và chiến lược. Tình huống tiến thoái lưỡng nan của người tù là một trò chơi liên quan đến hai người chơi - cả hai đều là những kẻ tình nghi phạm tội. Họ bị bắt và đưa đến đồn cảnh sát. Nếu cả hai nghi phạm bảo vệ nhau bằng cách giữ im lặng (được gọi là hợp tác trong thuật ngữ lý thuyết trò chơi), cảnh sát chỉ có đủ bằng chứng để tống mỗi người vào tù 5 năm.

Tuy nhiên, mỗi nghi phạm được cung cấp một thỏa thuận. Nếu một trong hai thú nhận ( đào tẩu khỏi mối quan hệ hợp tác), còn nghi phạm kia thì không, kẻ đào tẩu sẽ được tự do, trong khi nghi phạm kín tiếng sẽ phải ngồi tù 20 năm. Nếu cả hai thú nhận, cả hai đều phải nhận 10 năm tù.

Có vẻ như cả hai người chơi đều có lợi nhất khi hợp tác với nhau. Nhận bản án 20 năm tù là một kết cục không thể chấp nhận được. Vì có cơ hội để một trong số họ trốn thoát bằng cách đào tẩu, nên cả hai người chơi đều biết người kia đang suy nghĩ theo cùng những hướng này, cả hai đều phải đào tẩu vì tư lợi. Khi làm như vậy, các nghi phạm nhận bản án 10 năm. Đây không phải là kết quả tốt nhất, nhưng đó là chiến lược tốt nhất cho tình huống mà người chơi gặp phải.

Bất kỳ thỏa thuận hoặc lời hứa chân thành nào giữa hai người chơi để hợp tác chỉ đảm bảo rằng cả hai sẽ bí mật đào tẩu. Lời hứa chung không thú nhận thực sự khuyến khích việc thú nhận, dẫn đến sự tự do (kết quả tốt nhất cho cá nhân) cho những người tư lợi.

Đây là tình thế khó xử của tù nhân. Các nhà lý thuyết trò chơi đã xác định rằng thú tội luôn là câu trả lời cho cả hai bên trong trường hợp này. Lý do là mỗi bên phải cho rằng bên kia sẽ hành động chỉ vì tư lợi.

Chúng ta có thể kiểm tra tình hình bằng cách vẽ biểu đồ trên ma trận . Ma trận cho phép chúng tôi kiểm tra tất cả các chiến lược có thể có và kết quả mà các kết hợp sẽ tạo ra.

Để xác định động cơ, chúng tôi sẽ chỉ định một loạt các tùy chọn cho các kết quả khác nhau, với 1 đại diện cho kết quả tồi tệ nhất (20 năm tù) và 4 tùy chọn tốt nhất (miễn phí):

  • 20 năm: 1
  • 10 năm: 2
  • 5 năm: 3
  • Đi tự do: 4

Bây giờ chúng tôi biết kết quả và sở thích của mình, cũng như các chiến lược có sẵn của chúng tôi: không thú nhận (hợp tác giữa những người chơi) hoặc thú nhận (đào tẩu). Chúng ta có thể thấy cách kết hợp các chiến lược khác nhau sẽ tạo ra các kết quả khác nhau. Kết quả được thể hiện bằng các cặp số, với số đầu tiên đại diện cho Người chơi 1 và số thứ hai đại diện cho kết quả của Người chơi 2.

Bây giờ, hãy đánh giá các lựa chọn của bạn bằng cách kiểm tra các kết quả được trình bày trong mỗi cột. Nhìn vào cột đầu tiên, chúng ta thấy rằng 2 lớn hơn 1 và trong cột thứ hai, 4 lớn hơn 3. Vì vậy, chiến lược tốt nhất của bạn, bất kể đối tác của bạn làm gì, là đào tẩu (thú nhận). Vì kết quả của lời thú nhận của bạn tốt hơn kết quả của việc không thú nhận, đây được gọi là một hành động chiếm ưu thế nghiêm ngặt.

Tại sao một nhà lý thuyết trò chơi không nghiên cứu solitaire? Hãy đọc để tìm hiểu.

Lý thuyết trò chơi và gia đình Simpsons

Trong một tập của " The Simpsons ", anh chị em hoạt hình Bart và Lisa Simpson quyết định giải quyết tranh chấp theo cách cổ điển - chơi trò "oẳn tù tì". Khi xác định chiến lược của mình, Bart tự nghĩ: "Đá hay - không gì bằng!" Biết quá rõ về anh trai mình, Lisa đã dự đoán thành công hành động này bằng giấy [nguồn: Shor ].