Конверт Парадокс

8

Есть два конверта. Один содержит денег, а другой содержит денег. Точное количество « » мне неизвестно, но я знаю выше. Я выбираю один конверт и открываю его. Я вижу в нем денег, очевидно, где .x2xxyy{x,2x}

Теперь мне предлагают сохранить или поменять конверты.

Ожидаемое значение переключения: . Ожидаемое значение сохранения моего конверта - .(122y+1212y)=54yy

Кажется, я всегда должен менять конверты. Мои два вопроса:

Правильно ли это рассуждение?

Разве это не так, если мне не разрешают открыть конверт и посмотреть y сумма денег, а потом мне дают возможность переключаться на неопределенное время?

Кицунэ кавалерия
источник
2
Связанный: en.wikipedia.org/wiki/Two_envelopes_problem
Герр К.
1
Вы не можете просто принять ожидание, вы должны начать с убеждений о х и обновить свои убеждения в соответствии с правилом Байеса. Как только вы увидите y, ваши представления о том, какой конверт вы открыли, изменятся.
HRSE
Скажем, х равномерно распределен между 0 и , Тогда что?
Кицунэ кавалерия
@ KitsuneCavalry Нет такого распространения. (Пожалуйста, пришлите мне программу, генерирующую такой дистрибутив.) На самом деле не существует резолюции, которая генерирует убеждения, приведенные в вашем вопросе для всех значенийy, В ссылке герра К. это объясняется в en.wikipedia.org/wiki/…
Гискард
3
@Kitsune Cavalry Равномерное распределение по половинной линии (или целой линии) является общеизвестным неправильным предшествующим в байесовской статистике, см. Вкус stats.stackexchange.com/a/97790/28746 или stats.stackexchange.com/a/ 35794/28746
Алекос Пападопулос

Ответы:

5

Вот подход «ожидаемая полезность максимизация / теория игры» к этому вопросу (с чертой теоретико-множественной вероятности). В таких рамках ответы кажутся ясными.

ПРЕДПОСЫЛКИ

Нам говорят в абсолютной честности, что для x строго положительная денежная сумма, следующие два билета были помещены в коробку: {A=x,B=2x} с присвоенным идентификационным номером 1 а также {A=2x,B=x} с присвоенным идентификационным номером 0, Тогда ничья из Бернулли (p=0.5) случайная переменная была выполнена, и на основе результата и произошедшего события суммы x а также 2x были помещены в конверты A а также B, Нам не говорят, в чем ценностьx или какая сумма пошла на какой конверт.

Первый случай: выберите конверт с возможностью переключения, не открывая его

Первый вопрос: как выбрать конверт ? Это связано с предпочтениями. Итак, предположим, что мы ожидаем максимизаторы полезности, с функцией полезностиu(),

Мы можем смоделировать вероятностную структуру здесь, рассматривая две дихотомические случайные величины, A а также Bпредставляя конверты, и количество в них. Поддержка каждого{x,2x}, Но они не независимы. Поэтому мы должны начать с совместного распространения. В форме таблицы совместное распределение и соответствующие предельные распределения

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

Это говорит нам о том, что A а также B имеют идентичные маргинальные распределения.

Но это означает, что не имеет значения, как мы выбираем конверты, потому что мы всегда будем получать одну и ту же ожидаемую полезность ,

0.5u(x)+0.5u(2x)

Здесь мы сталкиваемся с составной игрой (как выбрать конверт) над двумя одинаковыми играми (каждый конверт). Мы можем выбратьA с вероятностью 1, 0или что-нибудь промежуточное (и дополнительно для B). Это не важно Мы всегда получим одинаковую ожидаемую полезность. Обратите внимание, что наше отношение к риску здесь не играет роли.

Поэтому мы выбираем конверт, скажем, Aи мы смотрим на это. Какая сейчас наша ожидаемая полезность? Точно так же, как до выбора . Выбор конверта любым способом не влияет на вероятность того, что внутри.

Нам разрешено переключаться. Скажем, мы делаем, и теперь мы держим конвертB, Какая сейчас ожидаемая полезность? Точно так же, как и раньше .

Для нас это два возможных состояния мира: выбрать A или выберите B, При любом выборе оба состояния мира подразумевают одинаковую ценность для выбранной / предполагаемой движущей силы (т. Е. Максимизируют ожидаемую полезность).

Так что здесь мы безразличны к переходу. и на самом деле мы могли бы также рандомизировать.

2-й случай: открытие конверта с возможностью переключения после

Предположим теперь, что мы выбрали A, открыл его, и нашел внутри суммы y{x,2x}, Это меняет вещи?

Посмотрим. Интересно, что это

P(A=xA{x,2x})=?

Хорошо, {x,2x} выборочное пространство, на котором случайная величина Aопределено. Обусловливание всего выборочного пространства, т. Е. Тривиальной сигма-алгебры, не влияет ни на вероятности, ни на ожидаемые значения. Как будто мы задаемся вопросом "какова ценностьA если мы знаем, что все возможные значения могли быть реализованы? »Эффективных знаний не было получено, поэтому мы все еще находимся в первоначальной вероятностной структуре.

Но мне также интересно, что это

P(B=xA{x,2x})=?

Условное утверждение, правильно рассматриваемое как сигма-алгебра, генерируемая событием {A{x,2x}}является целым пространством выборки продукта, на котором случайный вектор (A,B)был определен. Из приведенной выше таблицы совместного распределения мы можем видеть, что распределение вероятностей сустава эквивалентно распределению вероятностей маргиналов («почти наверняка» квалификация из-за наличия двух событий нулевой меры). Так что и здесь мы существенно обуславливаем вероятностиBна всем пространстве образца. Отсюда следует, что наше действие по вскрытию конверта не повлияло на вероятностную структуруB также.

Введите теорию игр, наряду с принятием решений. Мы открыли конверт, и мы должны решить, будем ли мы переключаться или нет. Если мы не переключаемся, мы получаем полезностьu(y), Если мы переключимся, то мы находимся в следующих двух возможных состояниях мира

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

Мы не знаем, какое состояние на самом деле имеет место, но из приведенного выше обсуждения мы знаем, что у каждого есть вероятность p=0.5 существующих.

Мы можем смоделировать это как игру, в которой наш противник - «природа» и где мы знаем, что природа играет определенно рандомизированную стратегию :p=0.5 y=x и с p=0.5, y=2x, Но мы также теперь, что, если мы не переключаемся, наша отдача наверняка. Итак, вот наша игра в нормальной форме, с нашими выплатами:

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

Мы должны противостоять искушению заменить u(x) а также u(2x) за u(y), u(y)это известная и определенная отдача. Окупаемость стратегии «Switch» на самом деле неизвестна (поскольку мы не знаем стоимостиx). Таким образом, мы должны отменить замену . Еслиy=x тогда u(2x)=u(2y), и если y=2x тогда u(x)=u(y/2), Итак, снова наша игра:

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

Теперь все выплаты в матрице известны. Есть ли чисто доминирующая стратегия?

Ожидаемая отдача от стратегии «Выключатель» составляет

E(VS)=0.5u(2y)+0.5u(y/2)

Ожидаемая отдача от стратегии «Не переключайся»

E(VDS)=u(y)

Мы должны переключиться, если

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

И теперь отношение к риску становится критическим. Нетрудно сделать вывод, что в условиях рискованного поведения и нейтрального к риску поведения мы должны перейти.

Что касается поведения , не склонного к риску , я нахожу элегантный результат:

Для «менее вогнутых» (строго выше) функций полезности, чем логарифмических (скажем, квадратный корень), тогда мы все равно должны переключиться.

Для логарифмической полезности u(y)=lnyНам безразлично между переключением или нет.

Для «более вогнутых», чем (строго ниже) логарифмических функций полезности, мы не должны переключаться.

Я закрываю диаграммой логарифмического случая

введите описание изображения здесь

Предполагать y=4, затемy/2=2,2y=8, ЛинияΓΔΕэто строка, на которой будет лежать ожидаемая утилита от «Switch». Так как природа играет5050 стратегия, это на самом деле будет в точке Δ, которая является средней точкой ΓΔΕ, В этот момент с логарифмической утилитой мы получаем точно такую ​​же утилиту из «Не переключать», т.е.ln(4) для этого числового примера.

Алекос Пападопулос
источник
Вызов «неприятия риска» через логарифмическую функцию полезности не разрешает парадокс. Как отмечает @HRSE, используя теорему Байеса, вероятности того, что выигрышиu(2y) а также u(y/2являются не 0,5 после просмотра суммы в первом конверте. Это будет иметь место только для крайне сомнительной формы, неподобающей доx (за x>0). При использовании надлежащего доx (отражая свои убеждения о x), решение становится переключаться, если y достаточно мал и сохранить первый конверт, если yдостаточно большой. См. Jstor.org/stable/2685310 .
Ярле Туфто
@JarleTufto На мой взгляд, единый априор является правильным априором, если кто-то решит поверить организаторам игры, когда они скажут, что денежные суммы были вложены в конверты после розыгрыша Бернулли с p=0.5, Если кто-то хочет быть подозрительным, не верить организаторам и формировать какое-то другое предварительное убеждение, это, конечно, его право, но он должен был бы прийти с некоторым аргументом, чтобы убедить меня в том, а) почему организаторы лгут и б) как выбирает ли он другой до того, как выберет. Обратите внимание, что мой ответ предполагает, что мы верим организаторам по этому вопросу.
Алекос Пападопулос
Я, конечно, согласен, что вам дают каждый конверт, содержащий суммы X а также 2Xсоответственно с равными вероятностями 1/2. То, что я говорю, - то, что неявная неправильная униформа доX что вы используете, то есть π(x)=1, для всех x>0 приводит к парадоксу, потому что теорема Байеса тогда приводит к P(X=y|Y=y)=P(X=y/2|Y=y)=1/2 где yэто наблюдаемая сумма в первом конверте. Используя надлежащий предварительныйπ(x) вместо этого эти условные вероятности различаются, и оптимальное решение зависит от y(и, конечно, функция полезности).
Ярле Туфто
@JarleTufto Этот неподходящий, прежде чем вы упомянули, он отражает вероятности, связанные с чем?
Алекос Пападопулос
Сумма денег в двух конвертах X а также 2X, Предыдущее распределение вероятностей отражает ваши убеждения оXперед открытием любого конверта. Вы либо неявно используете этот конкретный априор, либо совершаете ошибку приравнивания обратных условных вероятностей.
Ярле Туфто
0

Если вы откроете конверт E1 и увидите, что его значение равно E1 = Y , то верно, что значение другого конверта E2 находится в {E2 = Y / 2, E2 = 2Y} .

Также верно, что ожидаемое значение этой оболочки составляет (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

Ошибка в предположении , что Рг (Е2 = Y / 2) = Pr (Е2 = 2Y) = 1/2 , независимо от того, что Y есть. Упрощенный способ показать это состоит в том, чтобы предположить, что каждый конверт содержит американские бумажные деньги различных номиналов. Если Y = $ 1 , то для E2 невозможно быть Y / 2 .

Более строгое доказательство слишком подробно , чтобы обеспечить здесь, а краткое изложение этого является первым предположить , что для любого значения Z , что Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . По сути, это то же предположение, что и в предыдущем абзаце, расширенном до диапазона значений. Но если это верно для любого значения Z , это означает, что Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) является постоянным для каждого значения N , от -inf до инф. Поскольку это невозможно, предположение не может быть правильным.

+++++

Это может быть немного запутанным, поэтому позвольте мне попробовать пример. Вам дают два комплекта двух конвертов. В одном наборе они содержат 10 и 20 долларов. В другом они содержат 20 и 40. Вы выбираете набор, а затем открываете один конверт в этом наборе, чтобы найти 20. Затем вам предлагается возможность переключиться на другой конверт в этом наборе. Тебе следует?

Да, должен переключиться. Ожидаемое усиление при переключении на другую огибающую составляет [(20-10) + (20-40)] / 2 = +5.

Обратите внимание, что этот пример - то есть, зная, что вы нашли 20, а не 10 или 40, соответствует условиям, которые вы описываете в своем вопросе. Так что ваше решение работает. Но сам эксперимент не подходит под это описание. Если вы нашли 10 или 40, вероятность того, что у другого конверта будет 20, равна 100%. Ожидаемая прибыль +10 и -20 соответственно. И если вы усредните три возможных усиления по вероятностям, вы получите три значения, вы получите 10/4 + 5/2 - 20/4 = 0.

JeffJo
источник
Почему я предполагаю, что в конверте не может быть 50 центов? Кроме того, вопрос заключается в том, чтобы задавать вопросы о случаях, когда вы не знаете возможные суммы, которые могут быть в нем, только возможные относительные суммы, поэтому я не очень следую этому.
Кицунэ кавалерия
Я сказал, что это упрощенный подход. Все началось с «предположим, что каждый конверт содержит бумажные деньги США». Поскольку в бумажных деньгах США не может быть 50 центов, Pr (E2 =2|E1=1) = 1. Дело в том, что если предположить, что Y / 2 и 2Y одинаково вероятны, то, когда вы не знаете Y, предполагается фактическое распределение Y, которое невозможно достичь.
JeffJo
0

Обычно проблема неразрешима, потому что вы не указали процедуру рандомизации всего эксперимента.

Но пусть Y будет значением выбранного вами конверта, а X - другим конвертом. Ответ тогдаE[X|Y=y]- что является условным ожиданием . Однако, предполагая наиболее общее распределение Y, Y равномерно взят из всехR, Но потомPr(Y=y)=0и по парадоксу Бореля-Колмогорова ожидание неразрешимо.

Джон Рэмбо
источник
@JeffJo, я не могу комментировать под твоим постом из-за нехватки репутации. Я добавил этот ответ, потому что считаю, что он связан с вашим постом.
Джон Рэмбо