Монти прекрасно знал, была ли за дверью коза (или она была пуста). Этот факт позволяет игроку удвоить свой показатель успеха с течением времени, переключая «догадки» на другую дверь. Что если знания Монти были не идеальными? Что если иногда приз действительно находился в том же дверном проеме, что и коза? Но вы не могли этого увидеть, пока не выбрали и не открыли СВОЮ дверь? Можете ли вы помочь мне понять, как рассчитать ЕСЛИ - и насколько - игрок может улучшить свой успех, когда показатель точности Монти составляет менее 100%? Например: что если Монти не прав - в среднем 50% времени? Может ли Игрок ВСЕГДА получить выгоду от переключения его Угадай / Двери? Я полагаю, что если у Монти меньше 33,3% шансов на то, что Приз НЕ находится за дверью, лучший вариант для игрока - НЕ переключать свою дверь. Не могли бы вы дать мне способ подсчитать потенциальную выгоду от переключения, указав различные вероятности того, что Монти будет прав, если приз не находится за дверью? У меня нет ничего, кроме математики в средней школе, и мне 69 лет, поэтому, пожалуйста, будьте нежны.
Спасибо за предоставленные идеи и формулы. Похоже, что если «Падший Монти» точно предсказывает отсутствие Приза / Автомобиля только на 66%, то выигрыш НУЛЯ будет выгоден при переходе от вашего первоначального выбора дверей… потому что его коэффициент ошибок 33% является значением по умолчанию Базовая ставка за приз находится за ЛЮБОЙ дверью. Однако предполагается, что если Монти становится лучше, чем 66%, предсказывая, где НЕТ ПРИЗА, то переключение дает большую полезность. Я попытаюсь применить это рассуждение к игре, в которой «Эксперт» делает «экспертный прогноз», что один из трех примерно одинаково вероятных вариантов будет правильным. Я мало верю в то, что Эксперт прав, и я совершенно уверен, что его «коэффициент попадания» будет меньше 33% - больше как 15%. Мой вывод из этого будет то, что когдатот же вариант, что и у меня, я наверняка ошибаюсь, и должен измениться на один из двух других! ;-)
источник
Ответы:
Давайте начнем с обычной проблемы Монти Холла. Три двери, за одной из которых находится машина. У двух других есть козы позади них. Вы выбираете дверь № 1, и Монти открывает дверь № 2, чтобы показать вам, что за ней стоит коза. Стоит ли переключаться на дверь № 3? (Обратите внимание, что числа, которые мы используем для обозначения каждой двери, здесь не имеют значения. Мы можем выбрать любой порядок, и проблема та же, поэтому для упрощения мы можем просто использовать эту нумерацию.)
Ответ, конечно, да, как вы уже знаете, но давайте рассмотрим расчеты, чтобы увидеть, как они изменятся позже. Пусть будет индексом двери с автомобилем, а обозначает событие, которое Монти обнаружил, что в двери 2 есть коза. Нам нужно вычислить . Если это больше, чем , нам нужно переключить наше предположение на эту дверь (поскольку у нас есть только два оставшихся варианта). Эта вероятность определяется как: (Это просто применение правила Байеса с плоской, предшествующей ). равно 1: если автомобиль находится за дверью № 3, то у Монти не было иного выбора, кроме как открыть дверь 2 как он сделал.C M p(C=3|M) 1/2 p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3) C p(M|C=3) p(M|C=1) 1/2р(М|C=2)p(C=3|Mравно : если автомобиль находится за дверью 1, то у Монти был выбор, открыть одну из оставшихся дверей, 2 или 3. равно 0, потому что Монти никогда не открывает дверь, которую он знает, есть машина. Заполнив эти числа, мы получим:
этим результатом мы знакомы.1/2 p(M|C=2) p(C=3|M)=10.5+0+1=23
Теперь давайте рассмотрим случай, когда Монти не знает, в какую дверь входит автомобиль. Поэтому, когда он выбирает свою дверь (которую мы будем продолжать называть дверью № 2), он может случайно выбрать ту, у которой есть машина, потому что он думает, что у нее есть коза. Пусть будет дверью, которую, по мнению Монти, имеет автомобиль, и пусть будет вероятностью того, что он думает, что автомобиль находится в определенном месте, в зависимости от его фактического местоположения. Предположим, что это описывается одним параметром который определяет его точность, такой что: . Если равно 1, Монти всегда прав. ЕслиC′ р ( С ' | С ) д р ( С ' = х | С = х ) = д = 1 - р ( С ' ≠ х | С = х ) д д д 1 / 3p(C′|C) q p(C′=x|C=x)=q=1−p(C′≠x|C=x) q q 0, Монти всегда неправ (что все еще информативно). Если равно , информация Монти не лучше случайного угадывания.q 1/3
Это означает, что теперь мы имеем:p(M|C=3)=∑xp(M|C′=x)p(C′=x|C=3)
=p(M|C′=1)p(C′=1|C=3)+p(M|C′=2)p(C′=2|C=3)+p(M|C′=3)p(C′=3|C=3)
=12×12(1−q)+0×12(1−q)+1×q
=14−q4+q=34q+14
То есть, если автомобиль действительно находился за дверью 3, было три варианта, которые могли бы быть разыграны: (1) Монти подумал, что он позади 1, (2) Монти подумал 2 или (3) Монти подумал 3. Последний вариант имеет место с вероятностью (как часто он делает это правильно), два других делят вероятность того, что он делает это неправильно между ними. Затем, учитывая каждый сценарий, какова вероятность того, что он выбрал бы указать на дверь № 2, как он это сделал? Если бы он думал, что автомобиль был позади 1, эта вероятность была бы 1 в 2, поскольку он мог бы выбрать 2 или 3. Если бы он думал, что это было позади 2, он никогда бы не выбрал точку 2. Если бы он думал, что это было позади 3 Он всегда выбрал бы 2.q (1−q)
Мы можем аналогичным образом определить оставшиеся вероятности:p(M|C=1)=∑xp(M|C′=x)p(C′=x|C=1)
=12×q+1×12(1−q)
=q2+12−q2=12
Заполнив все это, мы получим: для проверки , когда , мы видим, что мы возвращаем наш первоначальный ответ .p(C=3|M)=34q+1412+34−34q+34q+14
=0.75q+0.251.5 q=1 11.5=23
Итак, когда мы должны перейти? Я для простоты предположу, что нам не разрешено переключаться на дверь, на которую указал Монти. И на самом деле, до тех пор, пока Монти, по крайней мере, в некоторой степени правдоподобен (в большей степени, чем случайные догадки), дверь, на которую он указывает, всегда будет меньше, чем у других, иметь машину, так что это нереальный вариант. для нас все равно. Таким образом, нам нужно учитывать только вероятности дверей 1 и 3. Но если раньше автомобиль не мог находиться за дверью 2, теперь этот вариант имеет ненулевую вероятность, и поэтому мы больше не должны переключаться когда , но лучше переключаться, когда (что раньше было то же самое). Эта вероятность определяется какp(C=3|M)>0.5 p(C=3|M)>p(C=1|M) p(C=1|M)=0.51.5=13 Так же, как в оригинальной задаче Монти Холла. (Это имеет смысл, поскольку Монти никогда не может указывать на дверь 1, независимо от того, что находится за ней, и поэтому он не может предоставить информацию об этой двери. Скорее, когда его точность падает ниже 100%, эффект заключается в том, что некоторая вероятность «просачивается» к двери 2 фактически имеет машину.) Итак, нам нужно найти такой, что :
q p(C=3|M)>13 0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
В общем, это был очень многословный способ выяснить, что, поскольку знания Монти об истинном местоположении автомобиля лучше, чем случайное предположение, вы должны поменять двери (что на самом деле довольно очевидно, когда вы об этом думаете ). Мы также можем рассчитать, насколько более вероятно, что мы выиграем при переходе, в зависимости от точности Монти, поскольку это определяется как:
(что, когда , дает ответ 2, что соответствует тому факту, что мы удваиваем наши шансы на победу, поменяв двери в первоначальной задаче Монти Холла.)p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5 q=1
Редактировать: Люди спрашивали о сценарии, где нам разрешено переключаться на дверь, на которую указывает Монти, что становится выгодным, когда , то есть когда Монти является (несколько) надежным "лжецом". В самом экстремальном сценарии, когда , это означает, что дверь, которую, по мнению Монти, в машине наверняка есть коза. Заметьте, однако, что в оставшихся двух дверях все еще может быть либо машина, либо коза.q<13 q=0
Преимущество перехода к двери 2 определяется следующим образом: который больше 1 (и, следовательно, стоит перейти к этой двери), если , т. е. если , который мы уже установлен был переломный момент. Интересно, что максимально возможное преимущество при переходе к двери 2, когда , составляет всего 1,5, по сравнению с удвоением ваших шансов на выигрыш в исходной задаче Монти Холла (когда ).p(C=2|M)p(C=1|M)=0.75−0.75q1.513=1.5−1.5q 1.5q<0.5 q<13 q=0 q=1
Общее решение дается путем объединения этих двух стратегий переключения: когда , вы всегда переключаетесь на дверь 3; в противном случае переключитесь на дверь 2.q>13
источник
q < 1/3
, потому что это не моделирует, насколько он вероятен быть точным, это моделирует, насколько вероятно, что он ошибается? Когда он приблизится к 0, это будет означать, что он всегда лжет, если может, и ваш ожидаемый выигрыш вернется к 2/3Это должна быть довольно простая вариация проблемы (хотя я отмечаю ваш ограниченный математический фон, поэтому я предполагаю, что это относительно). Я бы посоветовал вам сначала попытаться определить решение, зависящее от того, является ли Монте безошибочным или полностью ошибочным. Первый случай - это обычная проблема Монте-Холла, поэтому никакой работы там не требуется. Во втором случае вы рассматриваете дверь, которую он выбирает, как случайную по всем дверям, включая дверь с призом (то есть он может по-прежнему выбирать дверь без приза, но теперь это случайно). Если вы можете рассчитать вероятность выигрыша в каждом из этих случаев, то вы используете закон полной вероятности определить соответствующие вероятности выигрыша в случае, когда у Монте есть некоторый определенный уровень погрешности (определяемый вероятностью того, что мы непогрешимы по сравнению с полностью ошибочными).
источник
Основываясь на комментариях к ответу Бена, я собираюсь предложить две разные интерпретации этого варианта Монти Холла, в отличие от Рубена ван Бергена.
Первого я назову лжецом Монти, а второго ненадежным Монти. В обеих версиях проблема происходит следующим образом:
(0) Есть три двери, за одной из которых находится машина, а за двумя другими - козы, распределенные случайным образом.
(1) Участник выбирает дверь наугад.
(2) Монти выбирает дверь, отличную от двери участника, и утверждает, что за ней стоит коза.
(3) Участнику предлагается переключиться на третью незакрытую дверь, и проблема в том, «Когда участник должен переключиться, чтобы максимизировать вероятность обнаружения автомобиля за дверью?»
В лжеце Монти, на этапе (2), если участник выбрал дверь, содержащую козу, Монти выбирает дверь, содержащую автомобиль, с некоторой предопределенной вероятностью (т. Е. Существует вероятность от 0 до 100%, что он будет лгать, что козел за какой-то дверью). Обратите внимание, что в этом варианте Монти никогда не выбирает дверь, содержащую автомобиль (т.е. не может лгать), если участник выбрал автомобиль на шаге (1).
Чтобы ответить на проблему, нам нужно использовать некоторые уравнения. Я постараюсь сформулировать свой ответ так, чтобы он был доступен. Две вещи, которые, я надеюсь, не слишком смущают, это алгебраическое манипулирование символами и условная вероятность. Для первого мы будем использовать символы для обозначения следующего:
Продолжение:
So you see, when Monty always lies (akaPr(M|C¯))=1 ) then you have a zero chance of winning if you always switch, and if he never lies then the probability the car is behind the door you can switch to, Pr(S) , is 23 .
From this you can work out the optimal strategies for both Liar, and Unreliable Monty.
Addendum 1
In response to comment (emphasis mine):
This is as I understand, the Unreliable Monty Hall Problem introduced at the start of my answer.
Therefore, if Monty's door contains the car13 of the time, we have the probability of winning when you switch to the last unpicked door as:
Thus, there is no difference between switching, remaining with the original door or if allowed, switching to Monty's chosen door (in line with your intuition.)
источник
For some reason, a moderator decided to delete my own answer to my own question, on the grounds that it contained "discussion." I don't really see HOW I can explain what is the Best Answer without discussing what makes it work for me, and how it can be applied in practice.
I appreciate the insights and formulae which were provided in the previous answers. It appears to be that IF "Fallible Monty" is only 66% accurate in predicting the absence of a Prize/Car THEN there is ZERO benefit to switching from your original choice of doors....because his 33% error rate is the default base rate for the Prize being behind ANY door. One assumes, though, that IF Monty gets better than 66% at predicting where there is NO PRIZE THEN switching derives greater Utility.
источник