Бросайте кубик, пока он не попадет на любое число, кроме 4. Какова вероятность того, что результат> 4?

20

Игроку предоставляется честный шестигранный кубик. Чтобы выиграть, она должна бросить число больше 4 (то есть 5 или 6). Если она бросает 4, она должна катиться снова. Каковы ее шансы на победу?

Я думаю, что вероятность выигрыша , может быть выражена рекурсивно как:P(W)

P(W)=P(r=5r=6)+P(r=4)P(W)

Я приблизил к , запустив 1 миллион проб на Java, например:P(W)0.3999

import java.util.Random;
public class Dice {

    public static void main(String[] args) {
        int runs = 1000000000;
        int wins = 0;
        for (int i = 0; i < runs; i++) {
            wins += playGame();
        }
        System.out.println(wins / (double)runs);
    }

    static Random r = new Random();

    private static int playGame() {
        int roll;
        while ((roll = r.nextInt(6) + 1) == 4);
        return (roll == 5 || roll == 6) ? 1 : 0;
    }
}

И я вижу, что можно расширить следующим образом:P(W)

P(W)=13+16(13+16(13+16))...

Но я не знаю, как решить этот тип рекуррентного отношения, не прибегая к такого рода приближению. Является ли это возможным?

tronbabylove
источник
6
Это много усилий, чтобы установить отношение повторения. У вас есть веские основания полагать, что ответ - 0,4. Это сильный намек на то, что есть другой способ придумать проблему, которая дает вам прямой ответ. Ищите это. Ответ Geomatt приведет вас туда, что, в свою очередь, поможет вам понять, что здесь происходит, и даже поможет вам упростить другие проблемы, с которыми вы сталкиваетесь быстрее без такого рода усилий. Если кажется, что у кажущейся сложной проблемы простой ответ, вы всегда должны тратить время, чтобы выяснить, почему. Выплачивает огромные дивиденды позже.
Джоэл
8
Как только вы поймете, что из-за равных вероятностей всех шести результатов и независимости бросков нет ничего особенного в каком-либо конкретном результате этого эксперимента, становится очевидным, что все пять из возможных результатов одинаково вероятны.
whuber
6
Я немного разочарован тем, что никто еще не применил к этому захватывающее решение по цепочке Маркова :-) Math Stack Exchange имеет благородную традицию «решения по перерасходу», которое, как кажется, редко проникает в Cross Validated ...
Silverfish
2
Это 2/5, чтобы выбрать любой из из так что ваша симуляция, вероятно, верна. { 1 , 2 , 3 , 5 , 6 }{5,6}{1,2,3,5,6}
mathreadler
2
Этот пост против ответов - это то, что, как я полагаю, исследователи данных похожи на статистиков.
bdeonovic

Ответы:

47

Просто решите это с помощью алгебры:

P(W)=26+16P(W)56P(W)=26P(W)=25.
dsaxton
источник
2
Обратите внимание, что этот расчет действителен только потому, что свойство сильного Маркова выполняется для дискретных цепей Маркова.
Chill2Macht
Я не помню своих дискретных цепей Маркова, но из простой математики я бы рискнул сказать, что вы имеете в виду, что рекуррентное соотношение справедливо только из-за сильного свойства Маркова. После того как связь установлена, мы просто решаем для х.
josinalvo
Это верно?
josinalvo
1
@josinalvo: Технически, вопрос в том, означают ли P (W) по обе стороны уравнения одно и то же. Сильная Марковская Собственность подразумевает, что они делают. При отсутствии этого свойства P (W) слева означает «шанс выиграть с этим броском», а 1/6 * P (W) справа означает «шанс выиграть после броска 4».
MSalters
81

Примечание. Это ответ на первоначальный вопрос, а не повторение.

Если она бросает 4, то это по существу не считается, потому что следующий бросок независим. Другими словами, после броска 4 ситуация такая же, как когда она начала. Таким образом, вы можете игнорировать 4. Тогда результаты, которые могут иметь значение, 1-3 и 5-6. Есть 5 отличных результатов, 2 из которых выигрывают. Таким образом, ответ 2/5 = 0,4 = 40%.

GeoMatt22
источник
8
Вы можете сделать это немного более прямым: «Рассмотрим первый бросок, который не является 4. Затем результаты ...»
Джоэль
2
Глаза большинства людей закатываются, когда они видят тонны математики, поэтому мне этот нравится больше. По сути, вы удаляете 4 из результатов, так что это 1, 2, 3, 5, 6. Становится очевидным, что у вас есть 40% шанс на данный момент.
Нельсон
Я подумал об этом из названия, так что в основном я просто просмотрел полный вопрос после того, как щелкнул по нему. В противном случае я бы, наверное, запутался и догадался!
GeoMatt22
1
@ Нельсон Я видел больше людей, чьи глаза закатились, когда они видят подобные рассуждения в вероятностной проблеме, чем людей, чьи глаза закатили, когда они увидели . p=a+bp
JiK
Да. Мораль этой истории такова: не пытайтесь сделать проблему сложнее, чем нужно.
Джей
14

Ответы dsaxton ( /stats//a/232107/90759 ) и GeoMatt22 ( /stats//a/232107/90759 ) дают наилучшие подходы к проблеме. Другой, чтобы понять, что ваше выражение

P(W)=13+16(13+16())

Это действительно геометрическая прогрессия :

13+1613+16213+

В общем имеем

n=0a0qn=a01q

так что здесь у нас есть

P(W)=13116=13:56=615=25.

Конечно, способ доказать общую формулу для суммы геометрической прогрессии, используя алгебраическое решение аналогично dsaxton.

Мени Розенфельд
источник
@ Уильям, я не думаю, что ваш комментарий подходит по нескольким причинам. 1. Я никогда не говорил, что для этого нужны геометрические ряды. 2. Концепции, которые вы используете в своем ответе, являются гораздо более тяжелым механизмом, иронично говорить: «Вам не нужны геометрические ряды! Вам просто нужно гораздо более продвинутое и сложное сильное свойство Маркова». 3. Простое и строгое решение уже было предоставлено dsaxton. Ваш метод более обходной и избыточный для этой проблемы. 4. У ОП уже было выражение, эквивалентное геометрическому ряду, кто-то должен был это решать, а может быть и я.
Мени Розенфельд
1
@William: В конечном счете, ваш собственный ответ - хороший, проницательный и полезное дополнение к набору ответов на вопрос. Это не значит, что вы должны переходить к любому другому ответу и говорить, что ваш намного лучше. Они все тоже хорошо. Не ко всему нужно подходить самым абстрактным и общим способом.
Мени Розенфельд
Прошло много времени с тех пор, как я стал математиком, поэтому я прошу прощения, если мой ответ не был строгим. (Только, пожалуйста, не говорите мне, что это основывается на аксиоме выбора , поскольку это было бы унизительно!) :)
GeoMatt22
3

Все вышеприведенные ответы верны, но они не объясняют, почему они верны, и почему вы можете игнорировать так много деталей и избежать необходимости решать сложные отношения повторения.

Причина , почему другие ответы правильны является сильным свойством Маркова , который для дискретной цепи Маркова эквивалентна обычной марковского свойства. https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property

В основном идея заключается в том, что случайная величина

τ:=(

время остановки . https://en.wikipedia.org/wiki/Stopping_time Время остановки - это случайная величина, которая не зависит от какой-либо будущей информации .

nτ=nτ

τXτ

τ1τXτ>4

P(Xτ>4|τ=1)=P(Xτ>4|τ=2)==P(Xτ>4|τ=50,000,000)=

τ=1

P(X1>4|X4)=P(X1>4X14)P(X14)=P(X1>4)P(X14)=1356=1365=25
which of course is the correct answer.

You can read more about stopping times and the Strong Markov property in Section 8.3 of (the 4th edition of) Durrett's Probability Theory and Examples, p. 365.

Chill2Macht
источник
As far as I can tell from the wiki entry, the existence of a stopping time is necessary but not sufficient to say that a series of events exhibits the SMP. Sorry if I'm missing an in-joke or profound insight, but why not just assume that rolls are independent and get on with it?
Jacob Raihle
@JacobRaihle "Strong Markov property, which for a discrete Markov Chain is equivalent to the regular Markov property." This scenario clearly constitutes a discrete Markov chain. The rolls are independent, that's why it's a discrete Markov chain. The issue is that the event "first roll which does not land on 4" is not independent of the previous rolls, for reasons which are hopefully obvious.
Chill2Macht
It's equally clear that the rolls are independent. So what additional benefit does the SMP provide?
Jacob Raihle
@JacobRaihle Even though the value of the rolls are independent, the value of the die the first time it lands on a value not equal to 4 is NOT independent of the values on which the die landed on previous rolls.
Chill2Macht
It should be, since the rolling stops as soon as that happens. There can be no non-4 roll that isn't also the first one. And even if that were not the case, I'm not sure what kind of relationship you are suggesting.
Jacob Raihle
1

Another way to look at the problem.

Lets call a 'real result' a 1,2,3,5 or 6.

What is the probability of winning on the first roll, if you got a 'real result'? 2/5

What is the probability of winning on the second roll, if the second roll is the first time you got a 'real result'? 2/5

Same for third, fourth.

So, you can break your sample in (infinte) smaller samples, and those samples all give the same probability.

josinalvo
источник