Размер выборки для пропорций в повторных измерениях

Я пытаюсь помочь ученому разработать исследование для выявления микробов сальмонеллы. Он хотел бы сравнить экспериментальную антимикробную композицию с хлором (отбеливателем) на птицефабриках. Поскольку фоновые показатели содержания сальмонеллы различаются с течением времени, он планирует измерить% птицы с сальмонеллой до и после лечения. Таким образом, измерением будет разница до / после% сальмонеллы для экспериментальных и хлорных формул.

Кто-нибудь может посоветовать, как оценить необходимые размеры выборки? Допустим, фоновая ставка составляет 50%; после отбеливания это 20%; и мы хотим определить, меняет ли экспериментальный состав показатель на +/- 10%. благодарю вас

РЕДАКТИРОВАТЬ: я борюсь с тем, как включить фоновые ставки. Давайте назовем их p3 и p4, показатели "до" сальмонеллы для отбеливателя и экспериментальных образцов, соответственно. Таким образом, подлежащая оценке статистика представляет собой разницу различий: Экспериментальная (После-До) - Отбеливатель (После-До) = (p0-p2) - (p3-p1). Чтобы полностью учесть изменение выборки «до» скоростей p2 и p3 в расчете размера выборки - это так же просто, как использовать p0 (1-p0) + p1 (1-p1) + p2 (1-p2) + p3 (1-p3), где есть вариационный член в уравнении размера выборки? Пусть все размеры выборок равны, n1 = n2 = n.

sample-size repeated-measures proportion Павел
источник

Это отличный вопрос. Оптимальное решение будет зависеть от некоторых дополнительных факторов, в том числе (а) от основных элементов затрат, в том числе стоимости включения одной фермы и стоимости измерения одного субъекта; и (б) дизайн эксперимента. Например, будут ли применяться решения по лечению и контролю на каждой ферме (хороший выбор, но не без потенциальных проблем) или вы сможете применять только одно решение на каждой ферме? Будут ли предметы группироваться (физически) в пределах ферм или обрабатываться и отбираться ли они действительно случайным образом?

whuber

Я включил ваш дополнительный ответ в вопрос.

Ответы:

Давайте сделаем удар в приближении первого порядка, предполагая простую случайную выборку и постоянную долю инфекции для любого лечения. Предположим, что размер выборки достаточно велик, чтобы при проверке гипотезы о пропорциях можно было использовать нормальное приближение, чтобы мы могли рассчитать z-статистику следующим образом

$z = \frac{p_t - p_0}{\sqrt{p_0(1-p_0)(\frac{1}{n_1}+\frac{1}{n_2})}}$

Это образец статистики для теста с двумя образцами, новая формула против отбеливателя, поскольку мы ожидаем, что эффект отбеливания будет случайным, а также эффект новой формулы.

Тогда пусть , поскольку сбалансированные эксперименты имеют наибольшую мощность, и используйте ваши спецификации, которые , . Чтобы получить тестовую статистику (ошибка типа I около 5%), это работает до . Это разумный размер выборки для нормального приближения к работе, но это определенно нижняя граница. $n = n_1 = n_2$ $|p_t - p_0| \geq 0.1$ $p_0 = 0.2$ $|z| \geq 2$ $n \approx 128$

Я бы порекомендовал провести аналогичный расчет на основе требуемой мощности для теста, чтобы контролировать ошибку типа II, поскольку при недостаточной мощности высока вероятность пропуска фактического эффекта.

После того, как вы выполнили все эти основные подготовительные работы, начните изучать все, что вам нужно . В частности, из вашей постановки проблемы неясно, являются ли измеренные образцы домашней птицы различными группами субъектов или одними и теми же группами субъектов. Если они одинаковые, вы попали в зону парных t-тестов или повторных мер, и вам нужен кто-то умнее меня, чтобы выручить!

Майк Андерсон
источник

Хорошее начало (+1). Формула нуждается в некотором исправлении. Дисперсия разности пропорций равна p0 (1-p0) / n0 + p1 (1-p1) / n1. При n0 = n1 = n и p0 = .5, p1 = .2, что равно 0,41 / n, что означает n = 41 z ^ 2. Обратите внимание, что это односторонний тест, поэтому z = 1.65 работает нормально. (Здесь необходима некоторая точность, потому что результат чувствителен к квадрату z.) Независимо от этого, эти расчеты устанавливают, что приблизительно 10 ^ 2 независимых объекта необходимо будет проверить, если эта модель верна. (Я не ожидаю, что отбеливатель или новая формула будут иметь «случайные» эффекты.)

whuber

Майк Андерсон и Уубер, спасибо за ваши предложения. Вы задали хорошие вопросы, на которые я постараюсь ответить. Экспериментальные единицы по птице будут случайными, а не из кластеров. На данный момент стоимость не учитывается.

Пол