Меняется ли распределение вероятности урны, когда вы извлекаете ее без замены в среднем?

9

Предположим, у меня есть урна, содержащая N различных цветов шаров, и каждый другой цвет может появляться разное количество раз (если есть 10 красных шаров, то также не обязательно должно быть 10 синих шаров). Если мы знаем точное содержимое урны до рисования, мы можем сформировать дискретное распределение вероятностей, которое сообщает нам вероятность рисования каждого цвета шара. Что меня интересует, так это то, как меняется распределение после розыгрыша k шаров без замены урны в среднем., Я понимаю, что, извлекая из урны, мы можем обновлять дистрибутив, зная, что было удалено, но я хочу знать, что мы ожидаем, что форма распределения будет после того, как мы удалили k шаров. Распределение меняется в среднем или остается прежним? Если оно не останется прежним, можем ли мы записать некоторую формулу для того, как мы ожидаем, что новый дистрибутив будет выглядеть в среднем после выполнения k-ти дро?

mjnichol
источник
1
я могу ошибаться - но похоже, что кто-то знает предыдущее распределение, но не имеет никакой информации о вероятности (кроме того, что k шаров удалено). в этом случае - я бы предположил, что апостериор равен предыдущему. Чтобы быть справедливым - существует информация о вероятности того, что количество шаров уменьшилось и что (для одного удаленного шара) распределение, например, бимодально между 50% вероятности 9 красных и 10 черных и 50% вероятностью 10 красных и 9 черных , хотя я могу ошибаться
Wouter
Моя интуиция заключается в том, что это похоже на последний случай, который вы описали. Я не могу найти никого, кто бы говорил об этом процессе.
mjnichol

Ответы:

7
  1. «Прямой расчет»: пусть в урне будет шаров по цветов. Давайте сосредоточимся на вероятности нарисовать один конкретный цвет, скажем, белый , на втором рисунке . Пусть количество белых шаров будет . Пусть будет цветом шара, полученного на тираже.m n w X i inmnwXii

    P(X2=W)=P(X2=W|X1=W)P(X1=W)+P(X2=W|X1=W¯)P(X1=W¯)=nw1n1nwn+nwn1nnwn=nw(nnw+nw1)n(n1)=nwn=P(X1=W)

    Конечно, этот же аргумент применим к любому цвету на втором розыгрыше. Мы можем применить тот же тип аргумента рекурсивно при рассмотрении последующих розыгрышей.

    [Конечно, можно выполнить еще более прямой расчет. Рассмотрю первую рисует как состоящие из белых шаров и не-белых шаров (с вероятностью , заданной гипергеометрическим распределением), а также выполнять соответствующие вычисления простых один выше , но для розыгрыша на этапе ; каждый получает подобное упрощение и отмену, но это не особенно полезно для выполнения.]i k - i k + 1kikik+1

  2. Более короткий аргумент: рассмотрите возможность случайной маркировки шаров цифрами , а затем вытягивайте их в маркированном порядке. Теперь возникает вопрос: «Является ли вероятность того, что данный ярлык помещен на белый шар, такой же, как вероятность того, что ярлык окажется на белом шаре?»k 11,2,...,nk1

    Теперь мы видим, что ответ должен быть «да» по симметрии меток. Точно так же, из-за симметрии шаровых цветов, не имеет значения, что мы сказали «белый», поэтому аргумент, который помечаетk и метка имеют одинаковую вероятность, применим к любому цвету. Следовательно, распределение на k-м тираже такое же, как и для первого тиража, при условии, что у нас нет никакой дополнительной информации с более ранних тиражей (т. Е. До тех пор, пока ранее нарисованные шары не видны).1k

Glen_b - Восстановить Монику
источник
Еще один короткий аргумент, тесно связанный с вашим вторым способом: представьте набор всех возможных последовательностей, в которых шары могут быть удалены (например, сначала синий, затем белый, затем белый, ... может быть одна из таких последовательностей). Если для каждой последовательности в этом наборе мы меняем элементы и k t h , мы просто переставляем множество. Таким образом, для каждой последовательности с белым (или любым другим ) шаром в позиции k существует ровно одна соответствующая последовательность с белым шаром в позиции 1 . Следовательно, вероятность белого шара в положении k или положении 1 должна быть одинаковой. Я думаю, что это по сути аргумент Нейла. 1stkthk1k1
Серебряная рыба
@Silverfish Да, если посмотреть на это, мой второй аргумент по сути тот же, что и аргумент Нейла о перестановке.
Glen_b
Спасибо за объяснение. Это было именно то, что мне нужно было увидеть!
mjnichol
6

Единственная причина, по которой не совсем очевидно, что распределение остается неизменным (при условии, что остается хотя бы один шарик), заключается в том, что информации слишком много. Давайте удалим отвлекающий материал.

На мгновение проигнорируйте цвет каждого шара. Сосредоточиться на одном шаре. Предположим, что шаров будут случайно удалены (и не обнаружены), а затем будет получен и наблюден k + 1- й шар. Не имеет значения, в каком порядке происходит выбор, поэтому вы можете также наблюдать самый первый выпавший мяч (а затем убрать еще k шариков, если вы настаиваете). Распределение, очевидно, не изменилось, потому что оно не будет затронуто удалением других k шаров.kk+1kk


Этот аргумент - хотя и совершенно обоснованный - может заставить некоторых людей чувствовать себя неловко. Следующий анализ может быть принят как более строгий, потому что он не просит нас игнорировать порядок выбора.

Продолжай фокусироваться на своем мяче. Он будет иметь некоторую вероятность того, что будет выбран в качестве k + 1- го шара. Хотя p k легко вычислить, нам не нужно знать его значение: все, что имеет значение, это то, что оно должно быть одинаковым для каждого шара (потому что все шары эквивалентны) и что оно не равно нулю. Но если бы он был нулем, ни один шар не имел бы никакой вероятности быть выбранным: до тех пор, пока остается хотя бы один шар, p k0 .pkk+1pkpk0

Обратите внимание на цвета снова. По определению, шанс того, что будет выбран конкретный цвет (после случайного удаления k шаров), является суммой шансов всех оригинальных C- цветных шаров, деленной на сумму шансов всех оригинальных шаров. Если изначально есть k C шаров цвета C и n шаров, то это значениеCkCkCCn

Prk(C)=kcpknpk=kcn.

Когда это не зависит от k , QED .k<nk

Whuber
источник
Спасибо за комментарий. Это помогло мне понять основные процессы больше!
mjnichol
2

kE(Dk)Dk

E(Dk)

E(D0)E(D1)E(D0)E(Di)

Нил Г
источник
E(Dk)
@mjnichol справа
Нил Г
0

«Ожидаемое распределение» не меняется. Можно использовать аргумент мартингейла! Позже добавлю к ответу (сейчас путешествую).

Распределение, обусловленное более ранними розыгрышами (для более поздних розыгрышей), изменяется только тогда, когда вы действительно наблюдаете за розыгрышами. Если вы достанете шарик из урны плотно закрытой рукой, а затем выбросите его, не наблюдая за его цветом (я эффективно использовал такой театр, как демонстрация класса), распределение не изменится. Этот факт имеет объяснение: вероятность - это информация, вероятность - это информационная концепция.

Таким образом, вероятности меняются только тогда, когда вы получаете новую информацию (то есть условные вероятности). Вытягивание мяча и выбрасывание его без наблюдения не даст вам никакой новой информации, так что ничего нового для условий. Поэтому, когда вы определяете фактический набор информации, он не изменился, поэтому условное распределение не может измениться.

 EDIT

Я не буду сейчас вдаваться в подробности этого ответа, добавлю только одну ссылку: Хосам М. Махмуд: «Модели урн Поля» (Chapman & Hall), в которой рассматриваются модели урн, подобные приведенным в этом вопросе, а также гораздо более обобщенная урна. схемы, также с использованием методов мартингейла для получения предельных результатов. Но методы мартингейла не нужны для вопроса в этом посте.

Къетил б Халворсен
источник
Распределение (для более поздних розыгрышей) не меняется, даже если вы действительно наблюдаете розыгрыши. Почему наблюдение должно что-то изменить?
Нил Г
1
@Neil Я думаю, что kjetil имеет в виду распределение, обусловленное наблюдаемыми розыгрышами .
Серебряная рыба
@ Silverfish: Ах, я вижу. Вы правы, мои извинения.
Нил Дж
Я буду редактировать, чтобы прояснить, когда дома через две недели. На данный момент отдых в Венеции ...
kjetil b halvorsen