Spieltheorie

Dec 09 2022
Spieltheorie ist laut Wörterbuch „der Zweig der Mathematik, der sich mit der Analyse von Strategien zum Umgang mit Wettbewerbssituationen befasst, in denen das Ergebnis der Handlungswahl eines Teilnehmers entscheidend von den Handlungen anderer Teilnehmer abhängt“. Stellen Sie sich die Spieltheorie wie ein Minispiel zwischen Ihnen und Ihren Konkurrenten vor.

Spieltheorie ist laut Wörterbuch „der Zweig der Mathematik, der sich mit der Analyse von Strategien zum Umgang mit Wettbewerbssituationen befasst, in denen das Ergebnis der Handlungswahl eines Teilnehmers entscheidend von den Handlungen anderer Teilnehmer abhängt“. Stellen Sie sich die Spieltheorie wie ein Minispiel zwischen Ihnen und Ihren Konkurrenten vor. Ich mag diese Definition, aber ich würde auch hinzufügen, dass es ein Bewusstsein geben muss, das soziale Situationen erfassen kann, um diese Strategie anwenden zu können. Es ist der philosophische Kampf zwischen Ihnen und Ihrem Gegner. Dies berücksichtigt auch, dass Ihr Gegner rational ist und den Wert maximieren möchte. Dies sollte zur optimalen Entscheidungsfindung führen oder, wie ich es gerne ausdrücke, zu einer nicht-exploitiven Strategie.

Nash-Gleichgewicht

Ein Nash-Gleichgewicht ist der Punkt in einem Spiel, an dem es für einen Spieler keinen Sinn macht, von seiner ursprünglichen Strategie abzuweichen.

Stellen Sie sich vor, Sie sind mit einem Freund zusammen und Sie beide beschließen, eine Partie Schere, Stein, Papier zu spielen. Was würdest du tun, wenn du auf die optimalste und unerreichbarste Art und Weise spielen wolltest? Die logischste Antwort ist, so unberechenbar wie möglich zu sein. Dies könnte sicherlich in einer kleinen Stichprobengröße von gespielten Runden funktionieren. Was wäre, wenn Sie beide entscheiden würden, Hunderte oder sogar Tausende von Runden zu spielen? Bei einer größeren Stichprobengröße wird es für Sie schwierig, ohne die Hilfe von Technologie so unberechenbar wie möglich zu sein.

Wenn Sie so optimal wie möglich spielen möchten, wäre es am besten, 33 % der Zeit mit Steinen, 33 % mit Papier und 33 % mit Scheren zu werfen. Wenn Sie in der Lage wären, einen Zufallszahlengenerator zu verwenden und alle drei zu spielen, würden Sie in 33 % der Fälle niemals verlieren. Sie würden niemals verlieren, denn egal, was Ihr Freund spielt und egal, wie viel er versucht zu randomisieren, Sie werden seinem nächsten Zug für immer voraus sein. Nehmen wir nun an, Ihr Freund ist intelligent wie Sie selbst und Sie wollten beide so GTO (Game Theory Optimal) wie möglich spielen. Bei einer ausreichend großen Stichprobengröße würden die Ergebnisse der Sitzung dazu führen, dass Sie und Ihr Freund in 50 % der Fälle gewinnen, und es gäbe keinen klaren Gewinner. Dies ist, wenn Sie das Nash-Gleichgewicht erreicht haben.

Abweichung implementieren

In einem Spiel wie Rochambeau haben Sie perfekte Informationen und das Endergebnis ist ein klares Ergebnis eines Gewinns, einer Niederlage oder eines Unentschiedens in jeder gespielten Runde. Die Implementierung einer GTO-Strategie wird den Verlustprozentsatz senken und weniger ausnutzbar sein. Künstliche Intelligenz muss noch eine GTO-Strategie perfektionieren, wenn sie gegen andere Agenten antritt. Sie können sehen, warum es nahezu unmöglich ist, Ihren Spielstil konsequent davon abzuhalten, ausgenutzt zu werden, aber es schadet nicht, es zu versuchen.

Eine Abweichung von der GTO-Strategie kann den Wert in jedem Spiel, das Sie spielen, maximieren. Nehmen wir an, nach dem ersten Tag, an dem Sie gegen Ihren Freund gespielt haben und niemand als klarer Sieger hervorgegangen ist, entscheiden Sie beide, dass Sie am nächsten Tag erneut spielen möchten. Sie wissen, dass Ihr Freund seine GTO-Strategie umsetzen wird, und Sie wissen es zunächst auch. Sie beide beginnen zu spielen und nach ein paar hundert Runden beschließt Ihr Freund, seinen Zufallszahlengenerator nicht mehr zu verwenden, da er nur 47 % der Runden gewinnt. Erkennen, dass Ihr Freund angefangen hat, suboptimal zu spielen und häufiger mit Steinen als mit Papier wirft. Wenn Sie versuchen, den Wert zu maximieren, müssen Sie abweichen. Man muss kein Mathematikgenie sein, um zu wissen, dass man, wenn man 35 % der Zeit statt 33 % Rock spielt, diesen Stil ausnutzen kann, indem man 35 % der Zeit Papier wirft.

Rand

Hier kommt meine zusätzliche Definition der Spieltheorie ins Spiel. Letztendlich ist GTO stark mathematisch getrieben, aber eine Komponente, die in jedem Szenario einen Vorteil schaffen kann, ist ein Vorteil. Soziales Bewusstsein in Wettbewerbssituationen kann Ihnen diesen Vorteil verschaffen und hilft, den Wert zu maximieren oder Verluste zu minimieren. Sich auf jede gespielte Runde zu konzentrieren und mentale Notizen zu machen, ist ein guter Weg, um einen Vorteil herauszupressen. Sie können sich auch auf physische Tells verlassen, wenn Ihr Gegner mit seinen Emotionen Schwierigkeiten hat. Der Grund, warum Sie Ihren Freund ausnutzen konnten, ist, dass er während eines Nash-Gleichgewichts abweichen wollte. Sie merkten nach ein paar hundert Runden, dass sie verloren hatten und wurden ungeduldig. Sie wollten damit beginnen, ein zufälliges Muster auszunutzen, um schneller Gewinnerergebnisse zu sehen. Gedankenspiele sind unerlässlich, um im Laufe der Zeit kleine Vorteile zu erzielen, aber es ist am besten, vorsichtig zu sein. Alle Informationen, die Sie Ihrem Gegner geben, machen Sie ausnutzbarer, es sei denn, Sie spielen natürlich GTO.