Предположим, у меня есть урна, содержащая N различных цветов шаров, и каждый другой цвет может появляться разное количество раз (если есть 10 красных шаров, то также не обязательно должно быть 10 синих шаров). Если мы знаем точное содержимое урны до рисования, мы можем сформировать дискретное распределение вероятностей, которое сообщает нам вероятность рисования каждого цвета шара. Что меня интересует, так это то, как меняется распределение после розыгрыша k шаров без замены урны в среднем., Я понимаю, что, извлекая из урны, мы можем обновлять дистрибутив, зная, что было удалено, но я хочу знать, что мы ожидаем, что форма распределения будет после того, как мы удалили k шаров. Распределение меняется в среднем или остается прежним? Если оно не останется прежним, можем ли мы записать некоторую формулу для того, как мы ожидаем, что новый дистрибутив будет выглядеть в среднем после выполнения k-ти дро?
источник
Ответы:
«Прямой расчет»: пусть в урне будет шаров по цветов. Давайте сосредоточимся на вероятности нарисовать один конкретный цвет, скажем, белый , на втором рисунке . Пусть количество белых шаров будет . Пусть будет цветом шара, полученного на тираже.m n w X i in m nw Xi i
Конечно, этот же аргумент применим к любому цвету на втором розыгрыше. Мы можем применить тот же тип аргумента рекурсивно при рассмотрении последующих розыгрышей.
[Конечно, можно выполнить еще более прямой расчет. Рассмотрю первую рисует как состоящие из белых шаров и не-белых шаров (с вероятностью , заданной гипергеометрическим распределением), а также выполнять соответствующие вычисления простых один выше , но для розыгрыша на этапе ; каждый получает подобное упрощение и отмену, но это не особенно полезно для выполнения.]i k - i k + 1k i k−i k+1
Более короткий аргумент: рассмотрите возможность случайной маркировки шаров цифрами , а затем вытягивайте их в маркированном порядке. Теперь возникает вопрос: «Является ли вероятность того, что данный ярлык помещен на белый шар, такой же, как вероятность того, что ярлык окажется на белом шаре?»k 11,2,...,n k 1
Теперь мы видим, что ответ должен быть «да» по симметрии меток. Точно так же, из-за симметрии шаровых цветов, не имеет значения, что мы сказали «белый», поэтому аргумент, который помечаетk и метка имеют одинаковую вероятность, применим к любому цвету. Следовательно, распределение на k-м тираже такое же, как и для первого тиража, при условии, что у нас нет никакой дополнительной информации с более ранних тиражей (т. Е. До тех пор, пока ранее нарисованные шары не видны).1 К
источник
Единственная причина, по которой не совсем очевидно, что распределение остается неизменным (при условии, что остается хотя бы один шарик), заключается в том, что информации слишком много. Давайте удалим отвлекающий материал.
На мгновение проигнорируйте цвет каждого шара. Сосредоточиться на одном шаре. Предположим, что шаров будут случайно удалены (и не обнаружены), а затем будет получен и наблюден k + 1- й шар. Не имеет значения, в каком порядке происходит выбор, поэтому вы можете также наблюдать самый первый выпавший мяч (а затем убрать еще k шариков, если вы настаиваете). Распределение, очевидно, не изменилось, потому что оно не будет затронуто удалением других k шаров.К к + 1 К К
Этот аргумент - хотя и совершенно обоснованный - может заставить некоторых людей чувствовать себя неловко. Следующий анализ может быть принят как более строгий, потому что он не просит нас игнорировать порядок выбора.
Продолжай фокусироваться на своем мяче. Он будет иметь некоторую вероятность того, что будет выбран в качестве k + 1- го шара. Хотя p k легко вычислить, нам не нужно знать его значение: все, что имеет значение, это то, что оно должно быть одинаковым для каждого шара (потому что все шары эквивалентны) и что оно не равно нулю. Но если бы он был нулем, ни один шар не имел бы никакой вероятности быть выбранным: до тех пор, пока остается хотя бы один шар, p k ≠ 0 .пК к + 1 пК пК≠ 0
Обратите внимание на цвета снова. По определению, шанс того, что будет выбран конкретный цвет (после случайного удаления k шаров), является суммой шансов всех оригинальных C- цветных шаров, деленной на сумму шансов всех оригинальных шаров. Если изначально есть k C шаров цвета C и n шаров, то это значениеС К С kC C n
Когда это не зависит от k , QED .k<n k
источник
источник
«Ожидаемое распределение» не меняется. Можно использовать аргумент мартингейла! Позже добавлю к ответу (сейчас путешествую).
Распределение, обусловленное более ранними розыгрышами (для более поздних розыгрышей), изменяется только тогда, когда вы действительно наблюдаете за розыгрышами. Если вы достанете шарик из урны плотно закрытой рукой, а затем выбросите его, не наблюдая за его цветом (я эффективно использовал такой театр, как демонстрация класса), распределение не изменится. Этот факт имеет объяснение: вероятность - это информация, вероятность - это информационная концепция.
Таким образом, вероятности меняются только тогда, когда вы получаете новую информацию (то есть условные вероятности). Вытягивание мяча и выбрасывание его без наблюдения не даст вам никакой новой информации, так что ничего нового для условий. Поэтому, когда вы определяете фактический набор информации, он не изменился, поэтому условное распределение не может измениться.
Я не буду сейчас вдаваться в подробности этого ответа, добавлю только одну ссылку: Хосам М. Махмуд: «Модели урн Поля» (Chapman & Hall), в которой рассматриваются модели урн, подобные приведенным в этом вопросе, а также гораздо более обобщенная урна. схемы, также с использованием методов мартингейла для получения предельных результатов. Но методы мартингейла не нужны для вопроса в этом посте.
источник