Ожидаемое количество различных цветов при рисовании без замены

15

Рассмотрим урну, содержащую шариков разных цветов, причем - это пропорция шариков цвета среди шариков ( ). Я рисую шариков из урны без замены и смотрю на число разных цветов среди нарисованных шариков. Каково ожидание как функции , в зависимости от подходящих свойств распределения ?Nр я я Н Σ я р я = 1 п NPpiiNipi=1nNγ n / N pγγn/Np

Чтобы лучше понять: если и для всех , то я всегда буду видеть ровно цветов, то есть . В противном случае, можно показать , что ожидание - IS . Казалось бы, для фиксированных и коэффициент умножения будет максимальным, если равномерен; может быть, ожидаемое количество разных цветов будет ограничено функцией и, например, энтропией p ?p i = 1 / P i n γ = P ( n / N ) γ > P ( n / N )N=Ppi=1/Pinγ=P(n/N)γ>P(n/N)PNn/Npn/Np

Это, похоже, связано с проблемой сборщика купонов, за исключением того, что выборка производится без замены, а распределение купонов не является равномерным.

a3nm
источник
1
Я думаю, что эту проблему можно сформулировать так: каково ожидаемое число ненулевых элементов в выборке из многомерного гипергеометрического распределения ?
Kodiologist

Ответы:

2

Предположим , у вас есть цветов , где к N . Пусть б я обозначаю число шаров цвета я так Е б я = N . Пусть В = { Ь 1 , ... , Ь к } , и пусть Е я ( B ) фиксировать множества, состоящие из я элементных подмножеств B . Пусть Q элементов из вышеуказанного набора таковы, что количество разных цветов в выбранном наборе равно c . ЗаkkNbiibi=NB={b1,,bk}Ei(B)iB обозначает количество способов, которыми мы можем выбратьnQn,cnc формула проста:c=1

Qn,1=EE1(B)(eEen)

Для c=2 мы можем считать наборы шариков размером которые имеют не более 2 цветов, минус количество наборов, которые имеют ровно цвет:1n1

Qn,2=EE2(B)(eEen)(k11)Qn,1

kc1c2kc1c2k ( k-c1(k11) - это количество способов добавить цвет к фиксированному цвету, чтобы у вас было 2 цвета, если у вас всего цветов. Общая формула, если у вас есть фиксированные цвета и вы хотите сделатьkc1c2 из них цвета , а общее количество цветов ( ) равно . Теперь у нас есть все, чтобы вывести общую формулу для :kc1c2kQn,c(kc1c2c1)Qn,c

Qn,c=EEc(B)(eEen)i=1c1(kici)Qn,i

Вероятность того, что у вас будет ровно цветов, если вы нарисуете шаров, равна:пcn

Pn,c=Qn,c/(Nn)

Также обратите внимание, что если .у>х(xy)=0y>x

Вероятно, есть особые случаи, когда формула может быть упрощена. Я не удосужился найти эти упрощения на этот раз.

Ожидаемое значение числа цветов, зависящее от следующее:n

γn=i=1kPn,ii
jakab922
источник
4
Вы называете вероятностью, но, похоже, вы определили ее как сумму целых чисел. Вы забыли разделить на что-то? Pn,c
Кодиолог
Да, я думаю, ты прав. Вам нужно разделить на , но, к сожалению, все равно это не так. Если и я делаю двойной расчет в приведенной выше формуле. (Nn)E,FEc(B)EF
jakab922
Похоже, формула может быть исправлена ​​с помощью метода сита. Я опубликую исправление позже сегодня.
jakab922