Рассмотрим урну, содержащую шариков разных цветов, причем - это пропорция шариков цвета среди шариков ( ). Я рисую шариков из урны без замены и смотрю на число разных цветов среди нарисованных шариков. Каково ожидание как функции , в зависимости от подходящих свойств распределения ?р я я Н Σ я р я = 1 п ≤ Nγ n / N p
Чтобы лучше понять: если и для всех , то я всегда буду видеть ровно цветов, то есть . В противном случае, можно показать , что ожидание - IS . Казалось бы, для фиксированных и коэффициент умножения будет максимальным, если равномерен; может быть, ожидаемое количество разных цветов будет ограничено функцией и, например, энтропией p ?p i = 1 / P i n γ = P ( n / N ) γ > P ( n / N )
Это, похоже, связано с проблемой сборщика купонов, за исключением того, что выборка производится без замены, а распределение купонов не является равномерным.
Ответы:
Предположим , у вас есть цветов , где к ≤ N . Пусть б я обозначаю число шаров цвета я так Е б я = N . Пусть В = { Ь 1 , ... , Ь к } , и пусть Е я ( B ) фиксировать множества, состоящие из я элементных подмножеств B . Пусть Q элементов из вышеуказанного набора таковы, что количество разных цветов в выбранном наборе равно c . Заk k≤N bi i ∑bi=N B={b1,…,bk} Ei(B) i B обозначает количество способов, которыми мы можем выбратьnQn,c n c формула проста:c=1
Дляc=2 мы можем считать наборы шариков размером которые имеют не более 2 цветов, минус количество наборов, которые имеют ровно цвет:1n 1
kc1c2kc1≤c2≤k ( k-c1(k−11) - это количество способов добавить цвет к фиксированному цвету, чтобы у вас было 2 цвета, если у вас всего цветов. Общая формула, если у вас есть фиксированные цвета и вы хотите сделатьk c1 c2 из них цвета , а общее количество цветов ( ) равно . Теперь у нас есть все, чтобы вывести общую формулу для :k c1≤c2≤k Qn,c(k−c1c2−c1) Qn,c
Вероятность того, что у вас будет ровно цветов, если вы нарисуете шаров, равна:пc n
Также обратите внимание, что если .у>х(xy)=0 y>x
Вероятно, есть особые случаи, когда формула может быть упрощена. Я не удосужился найти эти упрощения на этот раз.
Ожидаемое значение числа цветов, зависящее от следующее:n
источник