게임 이론

Dec 09 2022

사전에 따르면 게임 이론은 "참가자의 행동 선택 결과가 다른 참가자의 행동에 결정적으로 의존하는 경쟁 상황을 처리하기 위한 전략 분석과 관련된 수학의 한 분야"입니다. 게임 이론을 당신과 경쟁자 사이의 미니 게임처럼 생각하십시오.

사전에 따르면 게임 이론은 "참가자의 행동 선택 결과가 다른 참가자의 행동에 결정적으로 의존하는 경쟁 상황을 처리하기 위한 전략 분석과 관련된 수학의 한 분야"입니다. 게임 이론을 당신과 경쟁자 사이의 미니 게임처럼 생각하십시오. 나는 이 정의를 좋아하지만 이 전략을 적용할 수 있으려면 사회적 상황을 생각할 수 있는 의식이 있어야 한다고 덧붙이고 싶습니다. 그것은 당신과 당신의 상대 사이의 철학적 전투입니다. 이것은 또한 상대가 합리적이고 가치를 극대화하기를 원한다는 점을 고려한 것입니다. 이것은 가장 최적의 의사 결정 또는 내가 말하고 싶은 방식으로 비폭발적인 전략으로 이어져야 합니다.

N회분 평형

내쉬 균형은 플레이어가 초기 전략에서 벗어나는 것이 이치에 맞지 않는 게임의 지점입니다.

당신이 친구와 함께 있고 두 사람이 가위바위보 게임을 하기로 결정했다고 상상해보세요. 가장 최적이고 변명할 수 없는 방식으로 플레이하고 싶다면 어떻게 하시겠습니까? 가장 논리적인 대답은 가능한 한 예측할 수 없도록 노력하는 것입니다. 이것은 플레이된 라운드의 작은 샘플 크기에서 가장 확실하게 작동할 수 있습니다. 두 사람이 수백 또는 수천 라운드를 플레이하기로 결정했다면 어떻게 하시겠습니까? 더 큰 샘플 크기를 사용하면 기술의 도움 없이는 가능한 한 예측할 수 없게 됩니다.

최대한 최적의 플레이를 하고 싶다면 바위 33%, 보 33%, 가위 33%를 던지는 것이 가장 좋은 방법입니다. 난수 생성기를 사용할 수 있고 33%의 시간 동안 세 가지 모두를 플레이할 수 있다면 절대 지지 않을 것입니다. 친구가 무엇을 플레이하든 그가 얼마나 무작위화하려고 하든 상관없이 당신은 영원히 그들의 다음 수보다 앞서 있을 것이기 때문에 당신은 결코 지지 않을 것입니다. 이제 당신의 친구가 당신처럼 똑똑하고 둘 다 가능한 한 GTO(Game Theory Optimal)로 플레이하기를 원한다고 가정해 봅시다. 샘플 크기가 충분히 클 경우 세션 결과는 귀하와 귀하의 친구가 시간의 50%를 이기는 결과를 낳고 확실한 승자는 없을 것입니다. 이것은 내쉬 균형에 도달했을 때입니다.

편차 구현

Rochambeau와 같은 게임에서는 완벽한 정보를 가지고 있고 최종 결과는 플레이되는 각 라운드의 승리, 패배 또는 무승부의 명확한 결과입니다. GTO 전략을 구현하면 손실률이 낮아지고 악용 가능성이 줄어듭니다. 인공 지능은 다른 에이전트와 경쟁할 때 아직 GTO 전략을 완성하지 못했습니다. 자신의 플레이 스타일이 악용되지 않도록 지속적으로 유지하는 것이 거의 불가능한 이유를 알 수 있지만 시도하는 것은 나쁘지 않습니다.

GTO 전략에서 벗어나 플레이하는 모든 게임에서 가치를 극대화할 수 있습니다. 예를 들어, 친구와 첫 경기를 펼친 후 아무도 확실한 승자로 나오지 않았고 두 사람이 다음 날 다시 경기를 하기로 결정했다고 가정해 보겠습니다. 당신은 당신의 친구가 그들의 GTO 전략을 실행할 것이라는 것을 알고 있으며 당신도 처음에는 그렇습니다. 두 사람이 게임을 시작하고 몇 백 라운드 후에 친구는 라운드의 47%만 이기고 있기 때문에 자신 있게 난수 생성기 사용을 중단하기로 결정합니다. 친구가 차선책으로 플레이하기 시작했고 종이보다 더 자주 돌을 던지고 있다는 사실을 깨닫습니다. 가치를 극대화하려면 일탈해야 합니다. 33%가 아닌 35%의 시간 동안 록이 재생되고 있다면 35%의 시간 동안 종이를 던짐으로써 그 스타일을 이용할 수 있다는 것을 수학 천재가 필요하지 않습니다.

가장자리

여기에서 게임 이론에 대한 나의 추가 정의가 시작됩니다. 결국 GTO는 수학 중심이지만 모든 시나리오에서 이점을 만들 수 있는 구성 요소는 가장자리입니다. 경쟁 상황에서 사회적 의식을 가지면 우위를 점할 수 있고 가치를 극대화하거나 손실을 최소화하는 데 도움이 됩니다. 진행되는 각 라운드에 집중하고 정신 메모를 작성하는 것은 우위를 점할 수 있는 좋은 방법입니다. 상대가 감정적으로 힘든 시간을 보내고 있다면 신체적 정보에 의존할 수도 있습니다. 당신이 당신의 친구를 착취할 수 있었던 이유는 그들이 내쉬 균형 동안 이탈하기를 원했기 때문입니다. 그들은 몇 백 라운드 후에 그들이 지고 있다는 것을 깨달았고 참을성이 없어졌습니다. 그들은 승리 결과를 더 빨리 보기 위해 무작위 패턴을 활용하기를 원했습니다. 마인드 게임은 시간이 지남에 따라 작은 우위를 확보하는 데 필수적이지만 조심하는 것이 가장 좋습니다. 물론 GTO를 플레이하지 않는 한 상대방에게 제공하는 모든 정보는 당신을 더욱 악용하게 만듭니다.