У меня есть некоторые данные, которые я не могу предположить извлечь из нормальных распределений, и я хотел бы провести тесты эквивалентности между группами. Для обычных данных существуют такие методы, как TOST (два односторонних t-теста). Есть ли что-нибудь аналогичное TOST для ненормальных данных?
hypothesis-testing
equivalence
tost
Райан Томпсон
источник
источник
Ответы:
Логика TOST, используемая для статистики t и z тестов типа Вальда (т.е.θ / сθ и θ / σθ соответственно), может быть применена к аппроксимациям z для непараметрических тестов, таких как тесты по знаку, рангу знака и сумме рангов. Для простоты я предполагаю, что эквивалентность выражается симметрично с одним термином, но расширить мой ответ на асимметричные термины эквивалентности просто.
При этом возникает одна проблема: если человек привык выражать член эквивалентности (скажем,Δ ) в тех же единицах, что и θ , то член эквивалентности должен быть выражен в единицах конкретного знака, ранга со знаком или ранга сумма статистика, которая является как заумной, и в зависимости от N .
Однако можно также выразить термины эквивалентности TOST в единицах самой статистики теста. Считаем, что в TOST, еслиZ= θ / σθ , то Z1= ( Δ - θ ) / σθ и Z2= ( θ + Δ ) / σθ . Если мы примем ε = Δ / σθ , то Z1= ε - z и Z2= z+ ε . (Статистические данные, представленные здесь, оцениваются вправомхвосте:п1= P ( Z> з1) ип2= P ( Z> з2) .) Использование единицраспределенияzдля определения порога эквивалентности / релевантности может быть предпочтительным для непараметрических тестов, поскольку альтернатива определяет порог в единицах знаковых рангов или ранговых сумм, который может быть практически бессмысленным для исследователей и трудным для интерпретации.
Если мы признаем, что (для симметричных интервалов эквивалентности) невозможно отвергнуть любую нулевую гипотезу TOST, когдаε ≤ z1 - α , то мы можем приступить к принятию решений относительно соответствующего размера члена эквивалентности соответственно. Например, ε = z1 - α+ 0,5 .
Этот подход был реализован с опциями для исправления непрерывности и т. Д. В пакете tost для Stata (который теперь включает в себя конкретные реализации TOST для тестов Shapiro-Wilk и Shapiro-Francia), к которым вы можете получить доступ, набрав в Stata:Изменить: Почему логика TOST является здравым, и тестовые схемы эквивалентности были применены к сводным тестам, я был убежден, что мое решение было основано на глубоком непонимании приблизительной статистики для тестов Шапиро-Вилка и Шапиро-Франсии
источник
Это не TOST как таковой, но тест Комолгорова-Смирнова позволяет проверить значимость разницы между распределением выборки и вторым эталонным распределением, которое вы можете указать. Вы можете использовать этот тест, чтобы исключить конкретный тип другого распределения, но не других распределений в целом (по крайней мере, не без учета увеличения ошибок в тестах всех возможных альтернатив ... если это как-то возможно само). Альтернативная гипотеза для любого одного теста, как обычно, останется менее конкретной гипотезой «всеохватывающего».
Если вы можете согласиться с тестом распределительных различий между двумя группами, где нулевая гипотеза состоит в том, что две группы распределены одинаково, вы можете использовать тест Комолгорова-Смирнова для сравнения распределения одной группы с распределением другой группы. Вероятно, это обычный подход: игнорировать различия, если они не являются статистически значимыми, и обосновать это решение тестовой статистикой.
В любом случае, вы можете рассмотреть некоторые более глубокие вопросы, возникающие из подхода «все или ничего» к отклонению нулевой гипотезы. Одна из таких проблем очень популярна здесь, на Cross Validated: « Является ли тестирование нормальности« по существу бесполезным »? » Люди любят отвечать на вопросы о тестировании нормальности с вопросом: «Почему вы хотите это проверить?» Предполагается, что намерение, как правило, состоит в том, чтобы аннулировать причину тестирования, что в конечном итоге может привести в правильном направлении. Суть полезных ответов на вопрос, который я здесь связал, выглядит следующим образом:
Если вы все еще хотите пройти тест на эквивалентность, вот еще одна популярная дискуссия о перекрестной проверке, которая включает тестирование на эквивалентность.
источник
fail to
/reject
подход хорошо налаженные, большинство образцов не могут полностью исключить возможность того , что нулевой верно. Почти всегда есть некоторый шанс ложной ошибки отклонения, если кто-то настаивает на отклонении, что обычно не является буквально необходимым. Это было, вероятно, более важным моментом, который я намеревался сделать изначально. Надеюсь, теперь это будет немного яснее без удаленных вещейдает
С другой стороны, если мы возьмем:
дает:
Как и в случае с NHST, существуют тонкие проблемы мощности и ложноположительных ошибок, которые следует изучить при моделировании, прежде чем делать окончательные выводы.
Я думаю, что схожий (возможно, более общий метод) использует байесовскую статистику для сравнения апостериорной оценки любой вероятностной модели.
источник