Teoria do jogo

Dec 09 2022
A teoria dos jogos é, de acordo com o dicionário, “o ramo da matemática preocupado com a análise de estratégias para lidar com situações competitivas onde o resultado da escolha de ação de um participante depende criticamente das ações de outros participantes”. Pense na teoria dos jogos como um minijogo entre você e seus concorrentes.

A teoria dos jogos é, de acordo com o dicionário, “o ramo da matemática preocupado com a análise de estratégias para lidar com situações competitivas onde o resultado da escolha de ação de um participante depende criticamente das ações de outros participantes”. Pense na teoria dos jogos como um minijogo entre você e seus concorrentes. Gosto desta definição, mas acrescento também que tem de haver uma consciência capaz de conceber situações sociais para poder aplicar esta estratégia. É a batalha filosófica entre você e seu oponente. Isso também leva em consideração que seu oponente é racional e deseja maximizar o valor. Isso deve levar à tomada de decisão ideal ou, como gosto de dizer, a uma estratégia não exploratória.

Equilíbrio de Nash

Um Equilíbrio de Nash é o ponto em um jogo onde não faz sentido para um jogador se desviar de sua estratégia inicial.

Imagine que você está com um amigo e vocês dois decidem jogar pedra, papel e tesoura. Se você quisesse jogar da maneira mais otimizada e não explorável, o que faria? A resposta mais lógica é tentar ser o mais imprevisível possível. Isso certamente poderia funcionar em uma pequena amostra de rodadas jogadas. E se vocês dois decidissem que queriam jogar centenas ou até milhares de rodadas? Com um tamanho de amostra maior, será difícil para você ser o mais imprevisível possível sem a ajuda da tecnologia.

Se você quiser jogar o melhor possível, a melhor maneira seria jogar pedra 33%, papel 33% e tesoura 33% do tempo. Se você pudesse usar um gerador de números aleatórios e jogar todos os três, 33% das vezes, você nunca perderia. Você nunca perderia porque não importa o que seu amigo jogue e não importa o quanto ele esteja tentando randomizar, você sempre estará à frente do próximo movimento dele. Agora, digamos que seu amigo seja inteligente, como você, e vocês dois queiram jogar o mais GTO (Game Theory Optimal) possível. Com um tamanho de amostra maior o suficiente, os resultados da sessão resultariam em você e seu amigo ganhando 50% das vezes e não haveria um vencedor claro. É quando você atinge o Equilíbrio de Nash.

Implementação de Desvio

Em um jogo como o Rochambeau, você tem informações perfeitas e o resultado final é um resultado claro de vitória, derrota ou empate a cada rodada que é disputada. A implementação de uma estratégia GTO reduzirá a porcentagem de perda e será menos explorável. A Inteligência Artificial ainda precisa aperfeiçoar uma estratégia de GTO ao competir contra outros agentes. Você pode ver por que é quase impossível evitar que seu estilo de jogo seja explorável, mas não custa tentar.

O desvio da estratégia GTO pode maximizar o valor em qualquer jogo que você esteja jogando. Digamos que, depois daquele primeiro dia jogando contra seu amigo e ninguém saiu por cima como o vencedor claro, vocês dois decidem que querem jogar novamente no dia seguinte. Você sabe que seu amigo vai implementar a estratégia GTO dele e você também, inicialmente. Vocês dois começam a jogar e, depois de algumas centenas de rodadas, seu amigo decide parar de usar o gerador de números aleatórios porque está ganhando apenas 47% das rodadas. Perceber que seu amigo começou a jogar abaixo do ideal e está jogando pedra com mais frequência do que papel. Se você está tentando maximizar o valor, precisa se desviar. Não é preciso ser um gênio da matemática para saber que se rock está sendo tocado 35% do tempo, em vez de 33%, você pode explorar esse estilo jogando papel 35% do tempo.

Borda

É aqui que entra minha definição adicional para a teoria dos jogos. No final das contas, o GTO é fortemente orientado para a matemática, mas um componente que pode criar uma vantagem em todos os cenários é uma vantagem. Ser socialmente consciente em situações em que você está competindo pode lhe dar essa vantagem e ajudará a maximizar o valor ou minimizar as perdas. Concentrar-se em cada rodada que é jogada e criar notas mentais é uma boa maneira de espremer uma vantagem. Você também pode contar com informações físicas se seu oponente tiver dificuldades com suas emoções. A razão pela qual você foi capaz de explorar seu amigo é porque ele queria se desviar durante um Equilíbrio de Nash. Eles perceberam depois de algumas centenas de rodadas que estavam perdendo e ficaram impacientes. Eles queriam começar a explorar um padrão aleatório para obter resultados vencedores mais cedo. Os jogos mentais são essenciais para ganhar pequenas vantagens ao longo do tempo, mas é melhor ter cuidado. Qualquer informação que você dê ao seu oponente o torna mais explorável, a menos que você esteja jogando GTO, é claro.