Осборн, равновесия Нэша и правильность верований

12

В книге Осборна « Введение в теорию игр» равновесие по Нэшу описывается следующим образом (стр. 21–22):

Во-первых, каждый игрок выбирает свое действие в соответствии с моделью рационального выбора, учитывая ее убеждения относительно действий других игроков. Во-вторых, мнение каждого игрока о действиях других игроков является правильным.

Мне кажется, что это определение не полностью эквивалентно обычному определению равновесия Нэша как профиля стратегии, где стратегия каждого игрока является лучшим ответом на стратегии других.

Обычное определение ничего не говорит о убеждениях и, следовательно, допускает возможность того, что убеждения могут быть неверными.

Чтобы воспользоваться тривиальной возможностью, рассмотрим дилемму заключенного. Предположим, что каждый игрок считает, что другой игрок не признается. Так как признание является доминирующей стратегией, каждый игрок все равно должен признаться. Таким образом, действия составляют равновесие по Нэшу, хотя убеждения игроков полностью противоположны действительным действиям по равновесию.

Правильно ли я понимаю, что определение Осборна характеризует нечто иное, чем равновесие Нэша?

Джйотирмой Бхаттачарья
источник
Не «Обычное определение ничего не говорит о убеждениях и, следовательно, допускает возможность того, что убеждения могут быть неверными». Просто зависит от того факта, что в этих определениях всегда есть основополагающее предположение о рациональности?
Thorst

Ответы:

9

Введение языка убеждений здесь немного странно, учитывая, что убеждения имеют очень специфическое значение в других частях теории игр.

Действительно, описание Осборна напоминает Байесовское равновесие Нэша. Мы могли бы ввести понятие убеждений в нормальную форму полной информационной игры следующим образом: предположим, что с вероятностью каждый игрок i является «стратегическим» типом, который будет играть в соответствии с равновесием (по Нэшу) и с вероятностью 1 - я он выберет какую - то стратегию равномерно в случайном порядке (потому что, скажем, он равнодушен во всех действиях). Таким образом, у нас есть байесовская игра, в которой размышления о убеждениях более естественны.aяя1-aя

Концепция решения Байеса Нэша тогда говорит, что стратегия должна быть оптимальной, учитывая ожидаемую игру, вызванную стратегиями других игроков, и убеждения относительно их типов, подразумеваемые { a j } j i . Если мы посмотрим на пределе в I1 для всех я тогда Байеса равновесие Нэша этой игры будет совпадать с концепцией решения описанной Осборном.я{aJ}Jяaя1я


Я предполагаю, что причина, по которой Осборн написал это так, является педагогической, учитывая, что это вводный текст. Когда мы вводим студент статических игр, мы говорим им , что игрок лучшие реагируем на действия других игроков. Студенты, естественно, хотят знать, «как они могут реагировать на стратегию, выбранную одновременно, не зная, какой будет эта стратегия?» Во многих отношениях это философский вопрос. Общие ответыя

  • Если в игру играют часто, то (за исключением вопросов о других результатах, которые могут быть сохранены в повторных играх), мы можем рассматривать Нэша как равновесие в том смысле, что если мы сходимся там, мы можем разработать норму, в соответствии с которой люди продолжают играть в этом равновесии бесконечно (и ожидать, что другие будут делать то же самое).
  • Если игра действительно одноразовая, то мы обычно вызываем идею, что игроки будут пытаться предсказать, что будут делать другие, и наше представление о равновесии включает идею о том, что эти прогнозы должны быть правильными.

Похоже, что предсказания во втором пункте соответствуют «убеждениям», на которые ссылается Осборн. Тем не менее, важно подчеркнуть, что эти предсказания / «убеждения» являются просто неформальным / интуитивным инструментом, помогающим нам осмыслить происходящее в равновесии, и не являются частью определения такого равновесия. Само понятие равновесия Нэша совершенно не зависит от понятия верований (как вы заметили в комментарии, оно определяется только действиями), поэтому, когда Осборн продолжает формально определять равновесие Нэша, он делает это, не вызывая Идея верований вообще.

Вездесущий
источник
4

Введение веры делает концепцию NE сопоставимой с другими концепциями уточнения, такими как PBE и последовательное равновесие, но значение NE не изменяется.

Выпускник микро учебник Мас-Колелл, Уинстон и Грин (MWG) имеет результат для этого

σΓЕμ

  1. σμ ЧАСPr(ЧАС|σ)>0
  2. Система убеждений выводится из профиля стратегии через правило Байеса, когда это возможно.μσ

Таким образом, приведенный вами пример «Дилемма заключенного» показывает, что у игроков есть убеждения, противоположные тем, что действующая стратегия противника не выполняет, второе условие, которое требует, чтобы убеждения были получены из правила Байеса, когда это возможно. Фактически, это математический эквивалент второго требования определения Осборна: верность игрока относительно действий других игроков верна.

Герр К.
источник
Я думаю, что есть разница между MWG и Осборном. MWG говорят, что для равновесия по Нэшу «существует» система убеждений, которая делает его разумным. Мы молчим о том, какие убеждения есть у игроков. Осборн говорит, что у игроков действительно есть убеждения, и они правильные. Я думал, что последний меняет концептуальное значение NE, поскольку в обычном определении вообще не упоминаются убеждения, а пример Дилеммы Заключенного показывает, что стратегии не определяют уникально убеждения.
Джотирмой Бхаттачарья
@JyotirmoyBhattacharya: Я не думаю, что MWG «молчит о том, какие убеждения есть у игроков». Условие 2 предложения фактически требует, чтобы это убеждение было выведено из профиля стратегии равновесия с использованием правила Байеса, когда это возможно. Таким образом, в примере с PD, когда один игрок выбирает дефект с вероятностью 1, убеждение другого игрока также должно указывать вероятность 1 на дефекте действия и наилучшим образом реагировать при таком убеждении (что приводит к тому, что он также выбирает дефект).
г-н К.
@JyotirmoyBhattacharya: Однако вера в СВ не должна быть уникальной. Это связано с тем, что если для данного равновесия путь на игровом дереве выбирается с нулевой вероятностью, то правило Байеса не применяется, и поэтому любое убеждение на этом пути будет считаться «правильным» в NE. По этой же причине вводятся такие уточнения, как последовательное равновесие, чтобы исключить необоснованные убеждения относительно путей равновесия.
г-н К.
@JyotirmoyBhattacharya: Кроме того, поскольку это учебник для студентов, Осборн, возможно, выбрал язык, который является более интуитивным, чем математически строгим по педагогическим причинам. Для меня два условия в определении Осборна являются точными аналогами в предложении MWG.
Г-н К.
3

Пример дилеммы вашего заключенного работает только потому, что это игра с доминирующими стратегиями. Осборн прав.

Чтобы лучше реагировать на стратегию другого игрока, как в приведенном вами определении, я должен знать их стратегию. Другими словами, я должен иметь убеждения о том, что они делают, и эти убеждения должны быть правильными. Это укрепление концепции рационализируемости.

(σ,μ1)(σ,μ2)μ2σΣσяВя(σ-я)... «Я считаю, что это означает, что определение убеждений не является необходимым, потому что убеждения - это в точности правильная оценка профиля стратегии. Ссылка, одна из моих книг, дает обычное определение с цитированием по Нэшу (1950), и Затем мы обсудим два основных допущения: одно - правильные убеждения, а другое - рациональная игра с учетом этих правильных убеждений.

Pburg
источник
Но для опровержения чего-либо достаточно одного контрпримера. Если вы считаете Осборна утверждением, что его определение эквивалентно определению Нэша, то как справиться с контрпримером Дилеммы Заключенного? Я понимаю, что определение Осборна является усилением рационализируемости, я утверждаю, что это не равновесие Нэша по той простой причине, что здесь равновесие определяется действиями и убеждениями, тогда как равновесие Нэша совершенно ничего не говорит о убеждениях.
Джотирмой Бхаттачарья
1
Это определение, а не доказательство.
Пбург
Справедливо. Но это определение понятия, которое уже имеет другое общепринятое определение. Поэтому я ожидаю, что, если автор не упомянул иначе, он утверждает, что оба определения эквивалентны.
Джотирмой Бхаттачарья
чтобы было понятно, включает ли он эти комментарии в определение или в обсуждение? ps я отредактировал свой ответ
Пбург
Часть, которую я процитировал, это обсуждение. Сразу после этого он говорит (стр. 22) «Эти два компонента воплощены в следующем определении», а затем дает стандартное определение с точки зрения наилучшего ответа на стратегии, в котором вообще не упоминаются убеждения. Так где же убеждения воплощены в определении? И проблема не только в играх с доминирующими стратегиями. Вполне возможно создать примеры, в которых нет доминирующих стратегий, но стратегии равновесия по Нэшу являются лучшими ответами на убеждения, отличные от игры на равновесие.
Джотирмой Бхаттачарья
2

Возможно, я повторяю то, что было сказано ранее, но вот мое мнение об этом.

Я думаю, что мы сталкиваемся с обычной проблемой при сравнении двух разных моделей. Что означает «эквивалентность», не совсем очевидно, потому что два определения лежат в разных мирах или разных моделях. Однако, если «эквивалентность» правильно определена, я думаю, что можно понять смысл определения Осборна и показать, что он действительно «эквивалентен» NE.

Концепция решения, лежащая в основе цитируемого раздела, будет выглядеть примерно так:

sbя

Uя(sя* | s-язнак равнобя*)Uя(s' | s-язнак равнобя*) для всех s'Sя
бя*знак равноs-я*

п

Это сложная часть. Что это значит, что «каждый NE есть BE»? Конечно, не то, что «NE плюс любой профиль убеждений - это BE», как показал OP своим контр-примером. Тем не менее, это тот случай, когда «любой NE может стать BE для некоторого профиля веры ». Я думаю, что именно в этом смысле следует понимать утверждение «эквивалентности» Осборна

Обратите внимание, что у нас также есть следующее более «эквивалентное» утверждение: « Результатом игры является исход NE, если и только если это результат BE».

Мартин Ван дер Линден
источник
Но каждый BE не является NE, так как концепция BE - это ослабление рационализируемости, которое у нас строго слабее, чем NE.
Джотирмой Бхаттачарья
Как я уже писал, у меня проблемы с пониманием того, что значит БЫТЬ «не быть» NE, потому что они, кажется, живут в разных моделях. Вы имеете в виду, что некоторые стратегии, сыгранные в BE, не являются NE? Я думал, что это неправильно, но я мог что-то упустить. Если это то, что вы имеете в виду, не могли бы вы указать мне на контрпример? Это было бы очень полезно.
Мартин Ван дер Линден
Я не уверен, что BE - это ослабление рационализируемости. В моем понимании BE - это рационализуемость наряду с условием правильности гипотез, верно? Если это правильно, то БЫЛИ ли мы сильнее рационализируемости? (это, конечно, может зависеть от того, что называется концепцией решения «слабее / сильнее»)
Мартин Ван дер Линден