Существует ли «правило» для определения минимального размера выборки, необходимого для правильности t-теста?
Например, необходимо провести сравнение между двумя популяциями. Существует 7 точек данных из одной совокупности и только 2 точки данных из другой. К сожалению, эксперимент очень дорог и требует много времени, и получение большего количества данных не представляется возможным.
Можно ли использовать t-тест? Почему или почему нет? Пожалуйста, предоставьте подробную информацию (различия и распределение населения неизвестны). Если t-критерий нельзя использовать, можно ли использовать непараметрический критерий (Манн Уитни)? Почему или почему нет?
t-test
sample-size
small-sample
wilcoxon-mann-whitney
Джонни озадачен
источник
источник
Ответы:
Я бы рекомендовал использовать непараметрический U- критерий Манна-Уитни а не непарный t- критерий.
Абсолютного минимального размера выборки для t- теста не существует, но с уменьшением размеров выборки тест становится более чувствительным к предположению, что обе выборки взяты из популяций с нормальным распределением. С такими маленькими выборками, особенно с одной выборкой из двух, вы должны быть очень уверены, что распределения населения были нормальными - и это должно основываться на внешних знаниях, поскольку такие маленькие выборки сами по себе дают очень мало информации о нормальность или нет их распределения. Но вы говорите, что «различия и распределения населения неизвестны» (мой курсив).
U- критерий Манна-Уитни не требует каких-либо предположений о параметрической форме распределений, а требует только предположения о том, что распределения двух групп одинаковы при нулевой гипотезе.
источник
(отказ от ответственности: сегодня я не могу печатать хорошо: у меня сломана правая рука!)
Вопреки совету использовать непараметрический тест в других ответах, вы должны учитывать, что для очень малых размеров выборки эти методы не очень полезны. Легко понять, почему: в исследованиях с очень маленьким размером различие между группами не может быть установлено, за исключением случаев, когда наблюдается большой эффект. Непараметрические методы, однако, не заботятся о величине разницы между группами. Таким образом, даже если разница между двумя группами огромна, при крошечном размере выборки непараметрический тест всегда не сможет отклонить нулевую гипотезу.
Рассмотрим этот пример: две группы, нормальное распределение, одна и та же дисперсия. Группа 1: в среднем 1,0, 7 образцов. Группа 2: в среднем 5, 2 образца. Существует большая разница между средними.
Вычисленное значение p равно 0,05556, что не отвергает нулевую гипотезу (0,05). Теперь, даже если вы увеличите расстояние между двумя средними значениями в 10 раз, вы получите одно и то же значение p:
Теперь я предлагаю вам повторить ту же симуляцию с t-тестом и наблюдать за p-значениями в случае больших (в среднем 5 против 1) и огромных (в среднем 50 против 1) различий.
источник
Не существует минимального размера выборки для t-теста; Фактически, t-критерий был разработан для небольших образцов. В старые времена, когда таблицы печатались, вы видели таблицы t-теста для очень маленьких образцов (измеренных как df).
Конечно, как и в других тестах, при небольшой выборке только значительный эффект будет статистически значимым.
источник
Я предполагаю, что вы имеете в виду, что у вас есть 7 точек данных из одной группы и 2 точки данных из второй группы, обе из которых являются подмножествами популяций (например, подмножество мужчин и подмножество женщин).
Математика для t-теста может быть получена из этой странице Википедии . Мы возьмем независимый t-тест с двумя выборками, с неравными размерами выборки (7 против 2) и неравными отклонениями, так что примерно на полпути вниз по этой странице. Вы можете видеть, что расчет основан на средних и стандартных отклонениях. Имея только 7 субъектов в одной группе и 2 объекта в другой, вы не можете предполагать, что у вас есть хорошие оценки для среднего или стандартного отклонения. Для группы из 2 субъектов среднее значение - это просто значение, которое находится точно посередине двух точек данных, поэтому оно не очень хорошо оценено. Для группы из 7 субъектов размер выборки сильно влияет на дисперсии (и, следовательно, стандартные отклонения, которые являются квадратным корнем дисперсии), потому что экстремальные значения оказывают гораздо более сильный эффект, когда у вас меньшая выборка.
Например, если вы посмотрите на базовый пример на странице Википедии для стандартного отклонения вы увидите, что стандартное отклонение равно 2, и, следовательно, дисперсия (квадрат стандартного отклонения) равна 4. Но если бы у нас были только первые две точки данных (9 и 1), дисперсия будет 10/2 = 5, а стандартное отклонение будет 2,2, и если бы у нас были только последние два значения (4 и 16), дисперсия была бы 20/2 = 10 и стандартное отклонение будет 3,2. Мы по-прежнему используем одни и те же значения, но меньше их, и мы можем увидеть влияние на наши оценки.
В этом проблема использования логической статистики с небольшими размерами выборки, особенно сильно на ваши результаты будет влиять выборка.
Обновление: есть ли причина, по которой вы не можете просто сообщить результаты по теме и указать, что это исследовательская работа? Только с двумя случаями данные очень похожи на тематическое исследование, и они оба (1) важны для написания и (2) принятой практики.
источник
Интересная связанная статья: «Использование t-критерия Стьюдента с чрезвычайно малыми размерами samlpe» JCF de Winter (в практической оценке, исследовании и оценке) http://goo.gl/ZAUmGW
источник
Я бы порекомендовал сравнить полученные выводы с t-тестом и тестом Манна-Уитни, а также взглянуть на коробочные диаграммы и профильную вероятность среднего значения для каждой популяции.
источник
Поскольку тестирование, проведенное на небольших выборках, вероятно, не соответствует требованиям тестирования (в основном, нормальности популяций, из которых были взяты две выборки), я бы порекомендовал выполнить тест начальной загрузки (с неравными отклонениями) после Efron B, Тибширани Rj. Введение в Bootstrap. Бока-Ратон, Флорида: Chapman & Hall / CRC, 1993: 220-224. Код для начальной загрузки с использованием данных, предоставленных Johnny Puzzled в Stata 13 / SE, показан на рисунке выше.
источник
При размере выборки 2 лучше всего посмотреть на отдельные числа и даже не заниматься статистическим анализом.
источник