В книге Осборна « Введение в теорию игр» равновесие по Нэшу описывается следующим образом (стр. 21–22):
Во-первых, каждый игрок выбирает свое действие в соответствии с моделью рационального выбора, учитывая ее убеждения относительно действий других игроков. Во-вторых, мнение каждого игрока о действиях других игроков является правильным.
Мне кажется, что это определение не полностью эквивалентно обычному определению равновесия Нэша как профиля стратегии, где стратегия каждого игрока является лучшим ответом на стратегии других.
Обычное определение ничего не говорит о убеждениях и, следовательно, допускает возможность того, что убеждения могут быть неверными.
Чтобы воспользоваться тривиальной возможностью, рассмотрим дилемму заключенного. Предположим, что каждый игрок считает, что другой игрок не признается. Так как признание является доминирующей стратегией, каждый игрок все равно должен признаться. Таким образом, действия составляют равновесие по Нэшу, хотя убеждения игроков полностью противоположны действительным действиям по равновесию.
Правильно ли я понимаю, что определение Осборна характеризует нечто иное, чем равновесие Нэша?
источник
Ответы:
Введение языка убеждений здесь немного странно, учитывая, что убеждения имеют очень специфическое значение в других частях теории игр.
Действительно, описание Осборна напоминает Байесовское равновесие Нэша. Мы могли бы ввести понятие убеждений в нормальную форму полной информационной игры следующим образом: предположим, что с вероятностью каждый игрок i является «стратегическим» типом, который будет играть в соответствии с равновесием (по Нэшу) и с вероятностью 1 - я он выберет какую - то стратегию равномерно в случайном порядке (потому что, скажем, он равнодушен во всех действиях). Таким образом, у нас есть байесовская игра, в которой размышления о убеждениях более естественны.aя я 1 - ая
Концепция решения Байеса Нэша тогда говорит, что стратегия должна быть оптимальной, учитывая ожидаемую игру, вызванную стратегиями других игроков, и убеждения относительно их типов, подразумеваемые { a j } j ≠ i . Если мы посмотрим на пределе в I → 1 для всех я тогда Байеса равновесие Нэша этой игры будет совпадать с концепцией решения описанной Осборном.я { аJ}J ≠ я aя→ 1 я
Я предполагаю, что причина, по которой Осборн написал это так, является педагогической, учитывая, что это вводный текст. Когда мы вводим студент статических игр, мы говорим им , что игрок лучшие реагируем на действия других игроков. Студенты, естественно, хотят знать, «как они могут реагировать на стратегию, выбранную одновременно, не зная, какой будет эта стратегия?» Во многих отношениях это философский вопрос. Общие ответыя
Похоже, что предсказания во втором пункте соответствуют «убеждениям», на которые ссылается Осборн. Тем не менее, важно подчеркнуть, что эти предсказания / «убеждения» являются просто неформальным / интуитивным инструментом, помогающим нам осмыслить происходящее в равновесии, и не являются частью определения такого равновесия. Само понятие равновесия Нэша совершенно не зависит от понятия верований (как вы заметили в комментарии, оно определяется только действиями), поэтому, когда Осборн продолжает формально определять равновесие Нэша, он делает это, не вызывая Идея верований вообще.
источник
Введение веры делает концепцию NE сопоставимой с другими концепциями уточнения, такими как PBE и последовательное равновесие, но значение NE не изменяется.
Выпускник микро учебник Мас-Колелл, Уинстон и Грин (MWG) имеет результат для этого
Таким образом, приведенный вами пример «Дилемма заключенного» показывает, что у игроков есть убеждения, противоположные тем, что действующая стратегия противника не выполняет, второе условие, которое требует, чтобы убеждения были получены из правила Байеса, когда это возможно. Фактически, это математический эквивалент второго требования определения Осборна: верность игрока относительно действий других игроков верна.
источник
Пример дилеммы вашего заключенного работает только потому, что это игра с доминирующими стратегиями. Осборн прав.
Чтобы лучше реагировать на стратегию другого игрока, как в приведенном вами определении, я должен знать их стратегию. Другими словами, я должен иметь убеждения о том, что они делают, и эти убеждения должны быть правильными. Это укрепление концепции рационализируемости.
источник
Возможно, я повторяю то, что было сказано ранее, но вот мое мнение об этом.
Я думаю, что мы сталкиваемся с обычной проблемой при сравнении двух разных моделей. Что означает «эквивалентность», не совсем очевидно, потому что два определения лежат в разных мирах или разных моделях. Однако, если «эквивалентность» правильно определена, я думаю, что можно понять смысл определения Осборна и показать, что он действительно «эквивалентен» NE.
Концепция решения, лежащая в основе цитируемого раздела, будет выглядеть примерно так:
Это сложная часть. Что это значит, что «каждый NE есть BE»? Конечно, не то, что «NE плюс любой профиль убеждений - это BE», как показал OP своим контр-примером. Тем не менее, это тот случай, когда «любой NE может стать BE для некоторого профиля веры ». Я думаю, что именно в этом смысле следует понимать утверждение «эквивалентности» Осборна
Обратите внимание, что у нас также есть следующее более «эквивалентное» утверждение: « Результатом игры является исход NE, если и только если это результат BE».
источник