Я анализирую экспериментальные данные. Данные состоят из парного вектора типа лечения и биномиального исхода:
Treatment Outcome
A 1
B 0
C 0
D 1
A 0
...
В столбце результатов 1 означает успех, а 0 - сбой. Я хотел бы выяснить, значительно ли меняет результат лечение. Есть 4 различных лечения с каждым экспериментом, повторенным большое количество раз (2000 для каждого лечения).
Мой вопрос, могу ли я проанализировать бинарный результат, используя ANOVA? Или я должен использовать критерий хи-квадрат для проверки биномиальных данных? Кажется, что хи-квадрат предполагает, что пропорция будет равномерно разделена, а это не так. Другая идея состояла бы в том, чтобы суммировать данные, используя соотношение успехов и неудач для каждого лечения, а затем использовать пропорциональный тест.
Мне любопытно услышать ваши рекомендации для тестов, которые имеют смысл для такого рода биномиальных экспериментов успеха / неудачи.
источник
Возможно, некоторые считают это старомодным, но если вы хотите проверить только нулевую гипотезу всех групп, имеющих одинаковую вероятность успеха, то вы можете определить как количество успехов в группе , как число испытаний в группе , предполагаемую вероятность в группе будет равна , а затем использовать стабилизирующее дисперсию преобразование для бинома, которое Такой подход был (временами ) достаточно хорош для Фишера, поэтому может пригодиться и сегодня!ИксК К NК К К п^К= XК/ нК
Однако некоторые современные авторы весьма скептически относятся к преобразованию арксинуса, см., Например, http://www.mun.ca/biology/dschneider/b7932/B7932Final10Dec2010.pdf. Но эти авторы обеспокоены такими проблемами, как прогнозирование, где они показывают Арксинус может привести к проблемам. Если вас интересует только проверка гипотез, все должно быть в порядке. Более современный подход мог бы использовать логистическую регрессию.
источник
Я хотел бы отличаться от того, что вы думаете о тесте Chi-Sq. Это применимо, даже если данные не являются биномиальными. Он основан на асимптотической нормальности mle (в большинстве случаев).
Я бы сделал логистическую регрессию следующим образом:
где
Является ли эквивалент ANOVA, если есть отношение или нет.
Является ли тест А имеет некоторый эффект.
Является ли тест B имеет некоторый эффект.
Это тест С имеет некоторый эффект.
Теперь вы можете сделать дополнительные контрасты, чтобы найти то, что вас интересует. Это все еще тест chi-sq, но с различными степенями свободы (3, 1, 1 и 1 соответственно)
источник
Я думаю, что вы правы, что ANOVA не следует использовать для анализа биномиальной зависимой переменной. Многие люди используют это, чтобы сравнить средние значения переменной двоичного отклика (0 1), но это не должно использоваться, потому что это серьезно нарушает допущение дисперсии нормальности и равенства. Тесты хи-квадрат или логистическая регрессия лучше всего подходят для таких ситуаций.
источник