Определение размера выборки с пропорцией и биномиальным распределением

10

Я пытаюсь изучить некоторые статистические данные, используя книгу «Биометрия» Сокала и Рольфа (3e). Это упражнение в 5-й главе, которое охватывает вероятность, биномиальное распределение и распределение Пуассона. введите описание изображения здесь

Я понимаю, что есть формула для ответа на этот вопрос: Однако этого уравнения нет в этом тексте. Я хотел бы знать, как рассчитать размер выборки, зная только вероятность, желаемый уровень достоверности и биномиальное распределение. Есть ли какие-либо ресурсы по этой теме, на которые я могу указать? Я пробовал Google, но то, что я видел до сих пор, требует информации, к которой у меня нет доступа в этой проблеме.

Nзнак равно4(п-Q)2
сбитый с толку
источник
1
Вы хотите руководствоваться в путешествии, чтобы выяснить ответ, или вы бы предпочли просто получить ответ вместе с объяснением того, почему это ответ?
Jbowman
2
Путешествие звучит хорошо. Это не для класса, и ответ дается в конце вопроса. Я не хочу просто знать ответ - я уже знаю это! Я прошел курс статистики много лет назад, но тогда я этого не оценил. Я пытаюсь исправить это сейчас и действительно начать понимать основные закономерности. Буду признателен за помощь. Эта конкретная проблема, по-видимому, не соответствует остальным в этом разделе, и правильный подход не ясно продемонстрирован (мне) из информации о биномиальном распределении текста и приведенных примерах.
озадачен
1
Мне было бы очень интересно прочитать подробный ответ (с указаниями на дальнейшее чтение, где это необходимо) на этот вопрос.
Жубарб
2
Давайте рассмотрим конкретный простой пример; у вас есть 5 слайдов от человека, у которого есть возбудитель. Какова вероятность того, что вы не сможете правильно идентифицировать этого человека как имеющего возбудителя? Скрытое предположение заключается в том, что наличие / отсутствие патогена на предметном стекле не зависит от наличия / отсутствия возбудителя на других предметных стеклах, взятых из того же образца.
jbowman
1
Это было бы вероятностью получения 5 ложных негативов подряд:
озадачен

Ответы:

8

Это будет вероятность получения ложного негатива в 5 слайдах:

(0,80) ^ 5 = 0,32768

Аааа, так что для того, чтобы уменьшить вероятность ложных негативов ниже 1%, вы можете сделать:

> x <- matrix(c(0), nrow=25)
> for(i in 1:25) x[i] = (0.8)^i
> x
             [,1]
 [1,] 0.800000000
 [2,] 0.640000000
 [3,] 0.512000000
 [4,] 0.409600000
 [5,] 0.327680000
 [6,] 0.262144000
 [7,] 0.209715200
 [8,] 0.167772160
 [9,] 0.134217728
 [10,] 0.107374182
 [11,] 0.085899346
 [12,] 0.068719477
 [13,] 0.054975581
 [14,] 0.043980465
 [15,] 0.035184372
 [16,] 0.028147498
 [17,] 0.022517998
 [18,] 0.018014399
 [19,] 0.014411519
 [20,] 0.011529215
 [21,] 0.009223372
 [22,] 0.007378698
 [23,] 0.005902958
 [24,] 0.004722366
 [25,] 0.003777893

И найдите, что уровень ложных срабатываний составляет менее 1% при i = 21.

Большой! Спасибо. Я не могу поверить, что я этого не видел. Я пробовал все виды условных вероятностей и тому подобное по какой-то причине. Держать его просто глупо...

сбитый с толку
источник
1
Да, иногда самые легкие проблемы самые сложные!
jbowman