Мне дали статью, в которой сообщалось об исследовании, очень похожем на исследование, которое хочет провести моя лаборатория. Но я заметил, что для интересующей переменной, Duration, SD больше среднего ... так как эта длительность измеряется в минутах, она никогда не может быть отрицательной, и это кажется мне очень странным. Это произошло в двух исследованиях, о которых сообщается ниже.
Кроме того, это смешанный дизайн. Контроль v Обработка (между группами) и Время1, Время2, Время3 (повторные измерения). Вот средства (SD), N> 200
Time1 Time2 Time3
Control 15.1 (14.6) 14.4 (14.8) 13.3 (15.7)
Treatment 14.8 (13.2) 10.0 (12.2) 8.2 (9.9)
... они запустили ANOVA и сообщили о р <0,001.
Меня попросили использовать это в качестве основы для анализа мощности, чтобы определить размер выборки для нашего исследования. Я почти уверен, что это указывает на то, что данные не являются нормальными или имеют выбросы, и мне не удобно определять размер выборки на основе этого. Я просто далеко от базы?
источник
Ответы:
Стандартное отклонение может легко превысить среднее значение с неотрицательными или строго положительными данными.
Я бы описал случай для ваших данных как стандартное отклонение, близкое к среднему (не каждое значение больше, а те, которые больше, обычно близки). Для неотрицательных данных это довольно четко указывает на то, что данные искажены (например, гамма-распределение с коэффициентом вариации = 1 было бы экспоненциальным распределением, поэтому, если бы данные были гамма, они выглядели бы где-то рядом с экспоненциальным)
Тем не менее, при таком размере выборки ANOVA может не особенно пострадать от этого; неопределенность в оценке объединенной дисперсии будет довольно мала, поэтому мы могли бы рассмотреть, что между CLT (для средних) и теоремой Слуцкого (для оценки дисперсии по знаменателю) ANOVA, вероятно, будет работать достаточно хорошо, так как вы ' будет иметь асимптотический хи-квадрат, для которого ANOVA-F с его большим знаменателем степеней свободы будет хорошим приближением. (то есть он должен иметь разумную устойчивость уровня, и поскольку средства не так уж далеки от постоянных, гетероскедастичность не должна слишком сильно влиять на силу)
Тем не менее, если ваше исследование будет иметь меньший размер выборки, вам, возможно, будет лучше взглянуть на другой тест (возможно, тест на перестановку или еще один, пригодный для искаженных данных, возможно, на основе GLM). Для изменения теста может потребоваться несколько больший размер выборки, чем для обычного ANOVA.
С исходными данными вы можете провести анализ мощности по подходящей модели / анализу. Даже в отсутствие исходных данных можно было бы сделать более правдоподобные предположения о распределении (возможно, разнообразные из них) и исследовать всю кривую мощности (или, проще говоря, только частоту ошибок типа I и мощность при любом значении эффекта). представляет интерес). Можно использовать различные разумные допущения, которые дают некоторое представление о том, какую мощность можно достичь при вероятных обстоятельствах и насколько большим может быть размер выборки.
источник
Вы правильно сделали вывод, что данные ненормальные. Если бы данные были нормальными, то мы ожидали бы, что около 16% наблюдений будут меньше среднего значения минус стандартное отклонение. Если SD больше среднего, это число является отрицательным, и вы заявляете, что не может быть отрицательных чисел, поэтому то, что вы видите, не согласуется с нормально распределенными данными. Значения SD возможны, но только если распределение очень искажено (что характерно для длительностей).
Я согласен, что выбор размера выборки, основанный на допущении, что данные будут нормальными, не очень хорошая идея, но если вы можете узнать больше о процессе и найти правильное искаженное распределение (гамма-распределение как одна из возможностей), которое является разумным предположением, тогда вы можете использовать это, чтобы помочь определить размер выборки.
источник