Я пытаюсь помочь ученому разработать исследование для выявления микробов сальмонеллы. Он хотел бы сравнить экспериментальную антимикробную композицию с хлором (отбеливателем) на птицефабриках. Поскольку фоновые показатели содержания сальмонеллы различаются с течением времени, он планирует измерить% птицы с сальмонеллой до и после лечения. Таким образом, измерением будет разница до / после% сальмонеллы для экспериментальных и хлорных формул.
Кто-нибудь может посоветовать, как оценить необходимые размеры выборки? Допустим, фоновая ставка составляет 50%; после отбеливания это 20%; и мы хотим определить, меняет ли экспериментальный состав показатель на +/- 10%. благодарю вас
РЕДАКТИРОВАТЬ: я борюсь с тем, как включить фоновые ставки. Давайте назовем их p3 и p4, показатели "до" сальмонеллы для отбеливателя и экспериментальных образцов, соответственно. Таким образом, подлежащая оценке статистика представляет собой разницу различий: Экспериментальная (После-До) - Отбеливатель (После-До) = (p0-p2) - (p3-p1). Чтобы полностью учесть изменение выборки «до» скоростей p2 и p3 в расчете размера выборки - это так же просто, как использовать p0 (1-p0) + p1 (1-p1) + p2 (1-p2) + p3 (1-p3), где есть вариационный член в уравнении размера выборки? Пусть все размеры выборок равны, n1 = n2 = n.
Ответы:
Давайте сделаем удар в приближении первого порядка, предполагая простую случайную выборку и постоянную долю инфекции для любого лечения. Предположим, что размер выборки достаточно велик, чтобы при проверке гипотезы о пропорциях можно было использовать нормальное приближение, чтобы мы могли рассчитать z-статистику следующим образом
Это образец статистики для теста с двумя образцами, новая формула против отбеливателя, поскольку мы ожидаем, что эффект отбеливания будет случайным, а также эффект новой формулы.
Тогда пусть , поскольку сбалансированные эксперименты имеют наибольшую мощность, и используйте ваши спецификации, которые , . Чтобы получить тестовую статистику (ошибка типа I около 5%), это работает до . Это разумный размер выборки для нормального приближения к работе, но это определенно нижняя граница.n=n1=n2 |pt−p0|≥0.1 p0=0.2 |z|≥2 n≈128
Я бы порекомендовал провести аналогичный расчет на основе требуемой мощности для теста, чтобы контролировать ошибку типа II, поскольку при недостаточной мощности высока вероятность пропуска фактического эффекта.
После того, как вы выполнили все эти основные подготовительные работы, начните изучать все, что вам нужно . В частности, из вашей постановки проблемы неясно, являются ли измеренные образцы домашней птицы различными группами субъектов или одними и теми же группами субъектов. Если они одинаковые, вы попали в зону парных t-тестов или повторных мер, и вам нужен кто-то умнее меня, чтобы выручить!
источник