Есть два конверта. Один содержит денег, а другой содержит денег. Точное количество « » мне неизвестно, но я знаю выше. Я выбираю один конверт и открываю его. Я вижу в нем денег, очевидно, где .
Теперь мне предлагают сохранить или поменять конверты.
Ожидаемое значение переключения: . Ожидаемое значение сохранения моего конверта - .
Кажется, я всегда должен менять конверты. Мои два вопроса:
Правильно ли это рассуждение?
Разве это не так, если мне не разрешают открыть конверт и посмотреть сумма денег, а потом мне дают возможность переключаться на неопределенное время?
microeconomics
expected-utility
Кицунэ кавалерия
источник
источник
Ответы:
Вот подход «ожидаемая полезность максимизация / теория игры» к этому вопросу (с чертой теоретико-множественной вероятности). В таких рамках ответы кажутся ясными.
ПРЕДПОСЫЛКИ
Нам говорят в абсолютной честности, что дляx строго положительная денежная сумма, следующие два билета были помещены в коробку: {A=x,B=2x} с присвоенным идентификационным номером 1 а также {A=2x,B=x} с присвоенным идентификационным номером 0 , Тогда ничья из Бернулли (p=0.5) случайная переменная была выполнена, и на основе результата и произошедшего события суммы x а также 2x были помещены в конверты A а также B , Нам не говорят, в чем ценностьx или какая сумма пошла на какой конверт.
Первый случай: выберите конверт с возможностью переключения, не открывая его
Первый вопрос: как выбрать конверт ? Это связано с предпочтениями. Итак, предположим, что мы ожидаем максимизаторы полезности, с функцией полезностиu() ,
Мы можем смоделировать вероятностную структуру здесь, рассматривая две дихотомические случайные величины,A а также B представляя конверты, и количество в них. Поддержка каждого{x,2x} , Но они не независимы. Поэтому мы должны начать с совместного распространения. В форме таблицы совместное распределение и соответствующие предельные распределения
Это говорит нам о том, чтоA а также B имеют идентичные маргинальные распределения.
Но это означает, что не имеет значения, как мы выбираем конверты, потому что мы всегда будем получать одну и ту же ожидаемую полезность ,
Здесь мы сталкиваемся с составной игрой (как выбрать конверт) над двумя одинаковыми играми (каждый конверт). Мы можем выбратьA с вероятностью 1 , 0 или что-нибудь промежуточное (и дополнительно для B ). Это не важно Мы всегда получим одинаковую ожидаемую полезность. Обратите внимание, что наше отношение к риску здесь не играет роли.
Поэтому мы выбираем конверт, скажем,A и мы смотрим на это. Какая сейчас наша ожидаемая полезность? Точно так же, как до выбора . Выбор конверта любым способом не влияет на вероятность того, что внутри.
Нам разрешено переключаться. Скажем, мы делаем, и теперь мы держим конвертB , Какая сейчас ожидаемая полезность? Точно так же, как и раньше .
Для нас это два возможных состояния мира: выбратьA или выберите B , При любом выборе оба состояния мира подразумевают одинаковую ценность для выбранной / предполагаемой движущей силы (т. Е. Максимизируют ожидаемую полезность).
Так что здесь мы безразличны к переходу. и на самом деле мы могли бы также рандомизировать.
2-й случай: открытие конверта с возможностью переключения после
Предположим теперь, что мы выбралиA , открыл его, и нашел внутри суммы y∈{x,2x} , Это меняет вещи?
Посмотрим. Интересно, что это
Хорошо,{x,2x} выборочное пространство, на котором случайная величина A определено. Обусловливание всего выборочного пространства, т. Е. Тривиальной сигма-алгебры, не влияет ни на вероятности, ни на ожидаемые значения. Как будто мы задаемся вопросом "какова ценностьA если мы знаем, что все возможные значения могли быть реализованы? »Эффективных знаний не было получено, поэтому мы все еще находимся в первоначальной вероятностной структуре.
Но мне также интересно, что это
Условное утверждение, правильно рассматриваемое как сигма-алгебра, генерируемая событием{A∈{x,2x}} является целым пространством выборки продукта, на котором случайный вектор (A,B) был определен. Из приведенной выше таблицы совместного распределения мы можем видеть, что распределение вероятностей сустава эквивалентно распределению вероятностей маргиналов («почти наверняка» квалификация из-за наличия двух событий нулевой меры). Так что и здесь мы существенно обуславливаем вероятностиB на всем пространстве образца. Отсюда следует, что наше действие по вскрытию конверта не повлияло на вероятностную структуруB также.
Введите теорию игр, наряду с принятием решений. Мы открыли конверт, и мы должны решить, будем ли мы переключаться или нет. Если мы не переключаемся, мы получаем полезностьu(y) , Если мы переключимся, то мы находимся в следующих двух возможных состояниях мира
Мы не знаем, какое состояние на самом деле имеет место, но из приведенного выше обсуждения мы знаем, что у каждого есть вероятностьр = 0,5 существующих.
Мы можем смоделировать это как игру, в которой наш противник - «природа» и где мы знаем, что природа играет определенно рандомизированную стратегию :р = 0,5 Y= х и с р = 0,5 , Y= 2 х , Но мы также теперь, что, если мы не переключаемся, наша отдача наверняка. Итак, вот наша игра в нормальной форме, с нашими выплатами:
Мы должны противостоять искушению заменитьты ( х ) а также ты ( 2 х ) за ты ( у) , ты ( у) это известная и определенная отдача. Окупаемость стратегии «Switch» на самом деле неизвестна (поскольку мы не знаем стоимостиИкс ). Таким образом, мы должны отменить замену . ЕслиY= х тогда у ( 2 х ) = у ( 2 г) , и если Y= 2 х тогда и ( х ) = и ( у/ 2) , Итак, снова наша игра:
Теперь все выплаты в матрице известны. Есть ли чисто доминирующая стратегия?
Ожидаемая отдача от стратегии «Выключатель» составляет
Ожидаемая отдача от стратегии «Не переключайся»
Мы должны переключиться, если
И теперь отношение к риску становится критическим. Нетрудно сделать вывод, что в условиях рискованного поведения и нейтрального к риску поведения мы должны перейти.
Что касается поведения , не склонного к риску , я нахожу элегантный результат:
Для «менее вогнутых» (строго выше) функций полезности, чем логарифмических (скажем, квадратный корень), тогда мы все равно должны переключиться.
Для логарифмической полезноститы ( у) = lnY Нам безразлично между переключением или нет.
Для «более вогнутых», чем (строго ниже) логарифмических функций полезности, мы не должны переключаться.
Я закрываю диаграммой логарифмического случая
ПредполагатьY= 4 , затемY/ 2=2,2г= 8 , ЛинияΓ - Δ - E это строка, на которой будет лежать ожидаемая утилита от «Switch». Так как природа играет50 - 50 стратегия, это на самом деле будет в точке Δ , которая является средней точкой Γ - Δ - E , В этот момент с логарифмической утилитой мы получаем точно такую же утилиту из «Не переключать», т.е.пер( 4 ) для этого числового примера.
источник
Если вы откроете конверт E1 и увидите, что его значение равно E1 = Y , то верно, что значение другого конверта E2 находится в {E2 = Y / 2, E2 = 2Y} .
Также верно, что ожидаемое значение этой оболочки составляет (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .
Ошибка в предположении , что Рг (Е2 = Y / 2) = Pr (Е2 = 2Y) = 1/2 , независимо от того, что Y есть. Упрощенный способ показать это состоит в том, чтобы предположить, что каждый конверт содержит американские бумажные деньги различных номиналов. Если Y = $ 1 , то для E2 невозможно быть Y / 2 .
Более строгое доказательство слишком подробно , чтобы обеспечить здесь, а краткое изложение этого является первым предположить , что для любого значения Z , что Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . По сути, это то же предположение, что и в предыдущем абзаце, расширенном до диапазона значений. Но если это верно для любого значения Z , это означает, что Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) является постоянным для каждого значения N , от -inf до инф. Поскольку это невозможно, предположение не может быть правильным.
+++++
Это может быть немного запутанным, поэтому позвольте мне попробовать пример. Вам дают два комплекта двух конвертов. В одном наборе они содержат 10 и 20 долларов. В другом они содержат 20 и 40. Вы выбираете набор, а затем открываете один конверт в этом наборе, чтобы найти 20. Затем вам предлагается возможность переключиться на другой конверт в этом наборе. Тебе следует?
Да, должен переключиться. Ожидаемое усиление при переключении на другую огибающую составляет [(20-10) + (20-40)] / 2 = +5.
Обратите внимание, что этот пример - то есть, зная, что вы нашли 20, а не 10 или 40, соответствует условиям, которые вы описываете в своем вопросе. Так что ваше решение работает. Но сам эксперимент не подходит под это описание. Если вы нашли 10 или 40, вероятность того, что у другого конверта будет 20, равна 100%. Ожидаемая прибыль +10 и -20 соответственно. И если вы усредните три возможных усиления по вероятностям, вы получите три значения, вы получите 10/4 + 5/2 - 20/4 = 0.
источник
Обычно проблема неразрешима, потому что вы не указали процедуру рандомизации всего эксперимента.
Но пусть Y будет значением выбранного вами конверта, а X - другим конвертом. Ответ тогдаE[X|Y=y] - что является условным ожиданием . Однако, предполагая наиболее общее распределение Y, Y равномерно взят из всехR , Но потомPr(Y=y)=0 и по парадоксу Бореля-Колмогорова ожидание неразрешимо.
источник