Оценка количества шаров путем последовательного выбора шара и его маркировки

9

Допустим, у меня в сумке N шаров. На моем первом розыгрыше я отмечаю мяч и помещаю его в сумку. Во время второго розыгрыша, если я беру отмеченный мяч, я возвращаю его в сумку. Однако, если я беру безымянный шарик, я отмечаю его и возвращаю в сумку. Я продолжаю это для любого количества розыгрышей. Каково ожидаемое количество шаров в сумке с учетом количества розыгрышей и отмеченной / немаркированной истории розыгрышей?

ashemon
источник
1
Возможно, связано: рассматривали ли вы метод улова-повторной поимки для оценки численности населения? ru.wikipedia.org/wiki/Mark_and_recapture
a.arfe,
«Ожидаемое число» не может быть понято в его обычном техническом смысле ожидаемого значения, поскольку для нет распределения вероятностей . Похоже , что вы просите для оценки из . NNN
whuber

Ответы:

2

Вот идея. Пусть конечное подмножество натуральных чисел , которые будут служить в качестве возможных значений для . Предположим, у нас есть предварительное распределение по . Устранение неслучайный целое положительное число . Пусть будет случайной величиной, обозначающей количество раз, которое мы помечаем шаром в извлекаемом из сумки. Цель состоит в том, чтобы найти . Это будет функцией и предыдущего. N I M k M E ( N | k ) M , kINIMkME(N|k)M,k

По правилу Байеса мы имеем

P(N=j|k)=P(k|N=j)P(N=j)P(k)=P(k|N=j)P(N=j)rIP(k|N=r)P(N=r)

Вычисление является известным расчетом, который является вариантом задачи по сбору купонов. P ( k | N = j ) - это вероятность того, что мы наблюдаем k различных купонов в M розыгрышах, когда всего имеется j купонов. Смотрите здесь для аргументаP(k|N=j)P(k|N=j)kMj

P(k|N=j)=(jk)k!S(M,k)jM

где обозначает число перемешивания второго рода . Затем мы можем рассчитатьS

E(N|k)=jIjP(N=j|k)

Ниже приведены некоторые расчеты для различных и . В каждом случае мы используем униформу доM [ k , 10 k ]kM[k,10k]

MkE(N)1057.991555.60151023.69301520.00302039.53
user35546
источник