Конверт Парадокс

Есть два конверта. Один содержит денег, а другой содержит денег. Точное количество « » мне неизвестно, но я знаю выше. Я выбираю один конверт и открываю его. Я вижу в нем денег, очевидно, где . $x$ $2x$ $x$ $y$ $y \in \{x, 2x\}$

Теперь мне предлагают сохранить или поменять конверты.

Ожидаемое значение переключения: . Ожидаемое значение сохранения моего конверта - . $(\frac{1}{2} \cdot 2y + \frac{1}{2} \cdot \frac{1}{2}y) = \frac{5}{4}y$ $y$

Кажется, я всегда должен менять конверты. Мои два вопроса:

Правильно ли это рассуждение?

Разве это не так, если мне не разрешают открыть конверт и посмотреть $y$ сумма денег, а потом мне дают возможность переключаться на неопределенное время?

microeconomics expected-utility Кицунэ кавалерия
источник

Связанный: en.wikipedia.org/wiki/Two_envelopes_problem

Герр К.

Вы не можете просто принять ожидание, вы должны начать с убеждений о х и обновить свои убеждения в соответствии с правилом Байеса. Как только вы увидите y, ваши представления о том, какой конверт вы открыли, изменятся.

HRSE

Скажем, х равномерно распределен между 0 и

\infty

$\infty$ , Тогда что?

Кицунэ кавалерия

@ KitsuneCavalry Нет такого распространения. (Пожалуйста, пришлите мне программу, генерирующую такой дистрибутив.) На самом деле не существует резолюции, которая генерирует убеждения, приведенные в вашем вопросе для всех значений

y

$y$ , В ссылке герра К. это объясняется в en.wikipedia.org/wiki/…

Гискард

@Kitsune Cavalry Равномерное распределение по половинной линии (или целой линии) является общеизвестным неправильным предшествующим в байесовской статистике, см. Вкус stats.stackexchange.com/a/97790/28746 или stats.stackexchange.com/a/ 35794/28746

Алекос Пападопулос

Ответы:

Вот подход «ожидаемая полезность максимизация / теория игры» к этому вопросу (с чертой теоретико-множественной вероятности). В таких рамках ответы кажутся ясными.

ПРЕДПОСЫЛКИ

Нам говорят в абсолютной честности, что для $x$ строго положительная денежная сумма, следующие два билета были помещены в коробку: $\{A=x, B= 2x\}$ с присвоенным идентификационным номером $1$ а также $\{A=2x, B= x\}$ с присвоенным идентификационным номером $0$ , Тогда ничья из Бернулли $(p=0.5)$ случайная переменная была выполнена, и на основе результата и произошедшего события суммы $x$ а также $2x$ были помещены в конверты $A$ а также $B$ , Нам не говорят, в чем ценность $x$ или какая сумма пошла на какой конверт.

Первый случай: выберите конверт с возможностью переключения, не открывая его

Первый вопрос: как выбрать конверт ? Это связано с предпочтениями. Итак, предположим, что мы ожидаем максимизаторы полезности, с функцией полезности $u()$ ,

Мы можем смоделировать вероятностную структуру здесь, рассматривая две дихотомические случайные величины, $A$ а также $B$ представляя конверты, и количество в них. Поддержка каждого $\{x, 2x\}$ , Но они не независимы. Поэтому мы должны начать с совместного распространения. В форме таблицы совместное распределение и соответствующие предельные распределения

\begin{array}{rr} A / B \to & x & 2 x & Marg A \\ x & 0 & 0.5 & 0.5 \\ 2 x & 0.5 & 0 & 0.5 \\ Marg B & 0.5 & 0.5 & 1.00 \end{array}

$\begin{array}{| r | r | } \hline \text{A} \;/ \;\;\text{B} \rightarrow & x & 2x & \text {Marg A} \\ \hline \hline x & 0 & 0.5 & 0.5\\ \hline 2x & 0.5 & 0 & 0.5 \\ \hline \text{Marg B} & 0.5 & 0.5 & 1.00 \\ \hline \end{array}$

Это говорит нам о том, что $A$ а также $B$ имеют идентичные маргинальные распределения.

Но это означает, что не имеет значения, как мы выбираем конверты, потому что мы всегда будем получать одну и ту же ожидаемую полезность ,

0.5 \cdot u (x) + 0.5 \cdot u (2 x)

$0.5 \cdot u(x) + 0.5\cdot u(2x)$

Здесь мы сталкиваемся с составной игрой (как выбрать конверт) над двумя одинаковыми играми (каждый конверт). Мы можем выбрать $A$ с вероятностью $1$ , $0$ или что-нибудь промежуточное (и дополнительно для $B$ ). Это не важно Мы всегда получим одинаковую ожидаемую полезность. Обратите внимание, что наше отношение к риску здесь не играет роли.

Поэтому мы выбираем конверт, скажем, $A$ и мы смотрим на это. Какая сейчас наша ожидаемая полезность? Точно так же, как до выбора . Выбор конверта любым способом не влияет на вероятность того, что внутри.

Нам разрешено переключаться. Скажем, мы делаем, и теперь мы держим конверт $B$ , Какая сейчас ожидаемая полезность? Точно так же, как и раньше .

Для нас это два возможных состояния мира: выбрать $A$ или выберите $B$ , При любом выборе оба состояния мира подразумевают одинаковую ценность для выбранной / предполагаемой движущей силы (т. Е. Максимизируют ожидаемую полезность).

Так что здесь мы безразличны к переходу. и на самом деле мы могли бы также рандомизировать.

2-й случай: открытие конверта с возможностью переключения после

Предположим теперь, что мы выбрали $A$ , открыл его, и нашел внутри суммы $y \in \{x, 2x\}$ , Это меняет вещи?

Посмотрим. Интересно, что это

P (A = x ∣ A \in {x, 2 x}) = ?

$P(A = x \mid A \in \{x, 2x\}) = ?$

Хорошо, $\{x, 2x\}$ выборочное пространство, на котором случайная величина $A$ определено. Обусловливание всего выборочного пространства, т. Е. Тривиальной сигма-алгебры, не влияет ни на вероятности, ни на ожидаемые значения. Как будто мы задаемся вопросом "какова ценность $A$ если мы знаем, что все возможные значения могли быть реализованы? »Эффективных знаний не было получено, поэтому мы все еще находимся в первоначальной вероятностной структуре.

Но мне также интересно, что это

P (B = x ∣ A \in {x, 2 x}) = ?

$P(B = x \mid A \in \{x, 2x\}) = ?$

Условное утверждение, правильно рассматриваемое как сигма-алгебра, генерируемая событием $\big \{A \in \{x, 2x\}\big\}$ является целым пространством выборки продукта, на котором случайный вектор $(A,B)$ был определен. Из приведенной выше таблицы совместного распределения мы можем видеть, что распределение вероятностей сустава эквивалентно распределению вероятностей маргиналов («почти наверняка» квалификация из-за наличия двух событий нулевой меры). Так что и здесь мы существенно обуславливаем вероятности $B$ на всем пространстве образца. Отсюда следует, что наше действие по вскрытию конверта не повлияло на вероятностную структуру $B$ также.

Введите теорию игр, наряду с принятием решений. Мы открыли конверт, и мы должны решить, будем ли мы переключаться или нет. Если мы не переключаемся, мы получаем полезность $u(y)$ , Если мы переключимся, то мы находимся в следующих двух возможных состояниях мира

y = x, u (A) = u (x) ⟹ u (B) = u (2 x)

$y = x, u(A) = u(x) \implies u(B) = u(2x)$

y = 2 x, u (A) = u (2 x) ⟹ u (B) = u (x)

$y = 2x, u(A) = u(2x)\implies u(B) = u(x)$

Мы не знаем, какое состояние на самом деле имеет место, но из приведенного выше обсуждения мы знаем, что у каждого есть вероятность $p=0.5$ существующих.

Мы можем смоделировать это как игру, в которой наш противник - «природа» и где мы знаем, что природа играет определенно рандомизированную стратегию : $p=0.5$ $y=x$ и с $p=0.5$ , $y=2x$ , Но мы также теперь, что, если мы не переключаемся, наша отдача наверняка. Итак, вот наша игра в нормальной форме, с нашими выплатами:

\begin{array}{rr} We / nature \to & y = x & y = 2 x \\ Switch & u (2 x) & u (x) \\ Don't Switch & u (y) & u (y) \end{array}

$\begin{array}{| r | r | } \hline \text{We} \;/ \;\;\text{nature} \rightarrow &y= x & y=2x \\ \hline \text{Switch} & u(2x) & u(x) \\ \hline \text{Don't Switch} & u(y) & u(y) \\ \hline \end{array}$

Мы должны противостоять искушению заменить $u(x)$ а также $u(2x)$ за $u(y)$ , $u(y)$ это известная и определенная отдача. Окупаемость стратегии «Switch» на самом деле неизвестна (поскольку мы не знаем стоимости $x$ ). Таким образом, мы должны отменить замену . Если $y=x$ тогда $u(2x) = u(2y)$ , и если $y=2x$ тогда $u(x) = u(y/2)$ , Итак, снова наша игра:

\begin{array}{rr} We / nature \to & y = x & y = 2 x \\ Switch & u (2 y) & u (y / 2) \\ Don't Switch & u (y) & u (y) \end{array}

$\begin{array}{| r | r | } \hline \text{We} \;/ \;\;\text{nature} \rightarrow &y= x & y=2x \\ \hline \text{Switch} & u(2y) & u(y/2) \\ \hline \text{Don't Switch} & u(y) & u(y) \\ \hline \end{array}$

Теперь все выплаты в матрице известны. Есть ли чисто доминирующая стратегия?

Ожидаемая отдача от стратегии «Выключатель» составляет

E (V_{S}) = 0.5 \cdot u (2 y) + 0.5 \cdot u (y / 2)

$E(V_S) = 0.5\cdot u(2y) + 0.5 \cdot u(y/2)$

Ожидаемая отдача от стратегии «Не переключайся»

E (V_{D S}) = u (y)

$E(V_{DS}) = u(y)$

Мы должны переключиться, если

E (V_{S}) > E (V_{D S}) ⟹ 0.5 \cdot u (2 y) + 0.5 \cdot u (y / 2) > u (y)

$E(V_S) > E(V_{DS}) \implies 0.5\cdot u(2y) + 0.5 \cdot u(y/2) > u(y)$

И теперь отношение к риску становится критическим. Нетрудно сделать вывод, что в условиях рискованного поведения и нейтрального к риску поведения мы должны перейти.

Что касается поведения , не склонного к риску , я нахожу элегантный результат:

Для «менее вогнутых» (строго выше) функций полезности, чем логарифмических (скажем, квадратный корень), тогда мы все равно должны переключиться.

Для логарифмической полезности $u(y) = \ln y$ Нам безразлично между переключением или нет.

Для «более вогнутых», чем (строго ниже) логарифмических функций полезности, мы не должны переключаться.

Я закрываю диаграммой логарифмического случая

Предполагать $y=4$ , затем $y/2 =2, 2y = 8$ , Линия $Γ-Δ-Ε$ это строка, на которой будет лежать ожидаемая утилита от «Switch». Так как природа играет $50-50$ стратегия, это на самом деле будет в точке $\Delta$ , которая является средней точкой $Γ-Δ-Ε$ , В этот момент с логарифмической утилитой мы получаем точно такую же утилиту из «Не переключать», т.е. $\ln(4)$ для этого числового примера.

Алекос Пападопулос
источник

Вызов «неприятия риска» через логарифмическую функцию полезности не разрешает парадокс. Как отмечает @HRSE, используя теорему Байеса, вероятности того, что выигрыши

u (2 y)

$u(2y)$ а также

u (y / 2

$u(y/2$ являются не 0,5 после просмотра суммы в первом конверте. Это будет иметь место только для крайне сомнительной формы, неподобающей до

x

$x$ (за

x > 0

$x>0$ ). При использовании надлежащего до

x

$x$ (отражая свои убеждения о

x

$x$ ), решение становится переключаться, если

y

$y$ достаточно мал и сохранить первый конверт, если

y

$y$ достаточно большой. См. Jstor.org/stable/2685310 .

Ярле Туфто

@JarleTufto На мой взгляд, единый априор является правильным априором, если кто-то решит поверить организаторам игры, когда они скажут, что денежные суммы были вложены в конверты после розыгрыша Бернулли с

p = 0.5

$p=0.5$ , Если кто-то хочет быть подозрительным, не верить организаторам и формировать какое-то другое предварительное убеждение, это, конечно, его право, но он должен был бы прийти с некоторым аргументом, чтобы убедить меня в том, а) почему организаторы лгут и б) как выбирает ли он другой до того, как выберет. Обратите внимание, что мой ответ предполагает, что мы верим организаторам по этому вопросу.

Алекос Пападопулос

Я, конечно, согласен, что вам дают каждый конверт, содержащий суммы

X

$X$ а также

2 X

$2X$ соответственно с равными вероятностями 1/2. То, что я говорю, - то, что неявная неправильная униформа до

X

$X$ что вы используете, то есть

π (x) = 1

$\pi(x) =1$ , для всех

x > 0

$x>0$ приводит к парадоксу, потому что теорема Байеса тогда приводит к

P (X = y | Y = y) = P (X = y / 2 | Y = y) = 1 / 2

$P(X=y|Y=y) = P(X=y/2|Y=y)=1/2$ где

y

$y$ это наблюдаемая сумма в первом конверте. Используя надлежащий предварительный

π (x)

$\pi(x)$ вместо этого эти условные вероятности различаются, и оптимальное решение зависит от

y

$y$ (и, конечно, функция полезности).

Ярле Туфто

@JarleTufto Этот неподходящий, прежде чем вы упомянули, он отражает вероятности, связанные с чем?

Алекос Пападопулос

Сумма денег в двух конвертах

X

$X$ а также

2 X

$2X$ , Предыдущее распределение вероятностей отражает ваши убеждения о

X

$X$ перед открытием любого конверта. Вы либо неявно используете этот конкретный априор, либо совершаете ошибку приравнивания обратных условных вероятностей.

Ярле Туфто

Если вы откроете конверт E1 и увидите, что его значение равно E1 = Y , то верно, что значение другого конверта E2 находится в {E2 = Y / 2, E2 = 2Y} .

Также верно, что ожидаемое значение этой оболочки составляет (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

Ошибка в предположении , что Рг (Е2 = Y / 2) = Pr (Е2 = 2Y) = 1/2 , независимо от того, что Y есть. Упрощенный способ показать это состоит в том, чтобы предположить, что каждый конверт содержит американские бумажные деньги различных номиналов. Если Y = $ 1 , то для E2 невозможно быть Y / 2 .

Более строгое доказательство слишком подробно , чтобы обеспечить здесь, а краткое изложение этого является первым предположить , что для любого значения Z , что Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . По сути, это то же предположение, что и в предыдущем абзаце, расширенном до диапазона значений. Но если это верно для любого значения Z , это означает, что Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) является постоянным для каждого значения N , от -inf до инф. Поскольку это невозможно, предположение не может быть правильным.

+++++

Это может быть немного запутанным, поэтому позвольте мне попробовать пример. Вам дают два комплекта двух конвертов. В одном наборе они содержат 10 и 20 долларов. В другом они содержат 20 и 40. Вы выбираете набор, а затем открываете один конверт в этом наборе, чтобы найти 20. Затем вам предлагается возможность переключиться на другой конверт в этом наборе. Тебе следует?

Да, должен переключиться. Ожидаемое усиление при переключении на другую огибающую составляет [(20-10) + (20-40)] / 2 = +5.

Обратите внимание, что этот пример - то есть, зная, что вы нашли 20, а не 10 или 40, соответствует условиям, которые вы описываете в своем вопросе. Так что ваше решение работает. Но сам эксперимент не подходит под это описание. Если вы нашли 10 или 40, вероятность того, что у другого конверта будет 20, равна 100%. Ожидаемая прибыль +10 и -20 соответственно. И если вы усредните три возможных усиления по вероятностям, вы получите три значения, вы получите 10/4 + 5/2 - 20/4 = 0.

JeffJo
источник

Почему я предполагаю, что в конверте не может быть 50 центов? Кроме того, вопрос заключается в том, чтобы задавать вопросы о случаях, когда вы не знаете возможные суммы, которые могут быть в нем, только возможные относительные суммы, поэтому я не очень следую этому.

Кицунэ кавалерия

Я сказал, что это упрощенный подход. Все началось с «предположим, что каждый конверт содержит бумажные деньги США». Поскольку в бумажных деньгах США не может быть 50 центов, Pr (E2 =

2 | E 1 =

$2|E1=$ 1) = 1. Дело в том, что если предположить, что Y / 2 и 2Y одинаково вероятны, то, когда вы не знаете Y, предполагается фактическое распределение Y, которое невозможно достичь.

JeffJo

Обычно проблема неразрешима, потому что вы не указали процедуру рандомизации всего эксперимента.

Но пусть Y будет значением выбранного вами конверта, а X - другим конвертом. Ответ тогда $E[X|Y=y]$ - что является условным ожиданием . Однако, предполагая наиболее общее распределение Y, Y равномерно взят из всех $\mathbb{R}$ , Но потом $Pr(Y=y)=0$ и по парадоксу Бореля-Колмогорова ожидание неразрешимо.

Джон Рэмбо
источник

@JeffJo, я не могу комментировать под твоим постом из-за нехватки репутации. Я добавил этот ответ, потому что считаю, что он связан с вашим постом.

Джон Рэмбо