Ожидаемое количество дубликатов (трижды и т. Д.) При рисовании с заменой

10

У меня есть следующая проблема:

У меня есть 100 уникальных предметов (n), и я выбираю 43 (м) из них по одному (с заменой).

Мне нужно найти ожидаемое количество уникальных (только один раз выбрано, k = 1), двойных чисел (выбрано ровно дважды k = 2), тройных чисел (ровно k = 3), четырехугольников и т. Д.

Я смог найти множество результатов о вероятности наличия хотя бы одного двойного (парадокс дня рождения), но не об ожидаемом количестве пар в популяции.

Кейтлин К
источник
Будет ли оценка Монте-Карло для вас полезной или вам нужен ответ в закрытой форме?
Дэвид Дж. Харрис
Я бы предпочел формулу закрытой формы, чтобы я мог легко применить ее к различным значениям n, m и k.
Кейтлин К

Ответы:

7

Iterm будет выбран раз. Из этого вы можете найти все нужные вам количества, потому что, например, Например, ожидаемое количество пар задается как БИНОМ ( м ,ithЕ [ число пар ] = п Σ я = 1 Р [ я т ч  элемент появляется дважды ] п P [ БИНОМ ( м ,Binom(m,1/n)

E[number of pairs]=i=1nP[ith item appears twice]
nP[Binom(m,1/n)=2].

Вы можете получить числовое значение в R с помощью команды n * dbinom (k, m, 1 / n).

Стефан Вейджер
источник
Можно ли использовать эту формулу для ak = 0 или 1?
Кейтлин К
Да, оно может. С k = 0 вы можете интерпретировать это как «сколько точек не появится среди m выбранных».
Стефан Вейджер
Но эти события не являются независимыми. Например, когда элемент 1 появляется m раз, другие элементы не могут появиться. Вы не можете просто сложить P.
asterix314