Можно ли провести силовой анализ для двустороннего теста Колмогорова Смирнова в R?
Я проверяю, отличаются ли два эмпирических распределения с помощью ks.test (), и собираюсь добавить анализ мощности.
Мне не удалось найти какой-либо встроенный анализ мощности для испытаний KS в R. Есть предложения?
Изменить : это случайно сгенерированные распределения, которые близко приближаются к моим данным (с истинными размерами выборки и оценочными темпами затухания для экспоненциальных распределений)
set.seed(100)
x <- rexp(64, rate=0.34)
y <- rexp(54,rate=0.37)
#K-S test: Do x and y come from same distribution?
ks.test(x,y)
Эти данные являются измерениями размера тела в двух разных группах. Я хочу показать, что две группы имеют по существу одинаковое распределение, но соавтор спросил меня, могу ли я сказать это в зависимости от размеров выборки. Я случайно выбрал экспоненциальное распределение, но оно близко к реальным данным.
До сих пор я говорил, что нет существенной разницы в этих дистрибутивах, основанных на двустороннем тесте KS. Я также подготовил два распределения. Как я могу показать, что у меня есть право сделать такое заявление, учитывая размеры выборки и скорости затухания для x и y?
Ответы:
Найти силу против экспоненциальных альтернатив со сдвигом масштаба достаточно просто.
Тем не менее, я не знаю , что вы должны использовать значение , вычисленное из данных , чтобы выяснить , что власть может быть. Такого рода вычисления мощности по принципу hoc имеют тенденцию приводить к нелогичным (и, возможно, вводящим в заблуждение) выводам.
Власть, как и уровень значимости, - это феномен, с которым вы сталкиваетесь до факта; вы бы использовали априорное понимание (включая теорию, рассуждения или любые предыдущие исследования), чтобы принять решение о разумном наборе альтернатив для рассмотрения и желаемом размере эффекта
Вы также можете рассмотреть множество других альтернатив (например, вы можете встроить экспоненту в гамма-семью, чтобы учесть влияние более или менее искаженных случаев).
Обычные вопросы, на которые можно попытаться ответить с помощью силового анализа:
1) какова мощность для данного размера выборки при некотором размере эффекта или наборе размеров эффекта *?
2) насколько велик эффект, определяемый размером выборки и мощностью?
3) Какой размер выборки необходим при желаемой мощности для определенного размера эффекта?
* (где здесь «величина эффекта» подразумевается в общем и может быть, например, конкретным соотношением средств или разностью средств, не обязательно стандартизированным).
Очевидно, у вас уже есть размер выборки, так что вы не в случае (3). Вы могли бы разумно рассмотреть вариант (2) или вариант (1).
Я бы предложил вариант (1) (который также дает возможность разобраться с вариантом (2)).
Чтобы проиллюстрировать подход к случаю (1) и увидеть, как он относится к случаю (2), давайте рассмотрим конкретный пример с:
альтернативы масштабного сдвига
экспоненциальные популяции
размеры выборки в двух выборках по 64 и 54
Поскольку размеры выборки различны, мы должны рассмотреть случай, когда относительный разброс в одной из выборок меньше и больше 1 (если они были одинакового размера, соображения симметрии позволяют рассмотреть только одну сторону). Однако, поскольку они довольно близки к одинаковому размеру, эффект очень мал. В любом случае исправьте параметр для одного из образцов и измените другой.
Итак, что вы делаете:
Заблаговременно:
Чтобы сделать расчеты:
В R я сделал это:
который дает следующую степень "кривой"
Ось X находится в логарифмическом масштабе, ось Y - коэффициент отклонения.
Трудно сказать здесь, но черные точки немного выше слева, чем справа (то есть, мощность немного больше, когда больший образец имеет меньший масштаб).
Используя обратный нормальный cdf в качестве преобразования коэффициента отклонения, мы можем сделать соотношение между преобразованным коэффициентом отклонения и логарифмом каппа (каппа находится
s
на графике, но ось x логарифмирована) очень почти линейно (за исключением около 0 ), и количество симуляций было достаточно высоким, чтобы шум был очень низким - мы можем просто проигнорировать его для настоящих целей.Таким образом, мы можем просто использовать линейную интерполяцию. Ниже показаны приблизительные размеры эффекта для мощности 50% и 80% при ваших размерах выборки:
Размеры эффекта на другой стороне (большая группа имеет меньший масштаб) лишь незначительно смещены от этого (может получить немного меньший размер эффекта), но это не имеет большого значения, поэтому я не буду разбираться с этим вопросом.
Таким образом, тест подберет существенную разницу (из соотношения шкал 1), но не небольшую.
Теперь о некоторых комментариях: я не думаю, что проверки гипотез особенно важны для основного вопроса, представляющего интерес ( действительно ли они похожи? ), И, следовательно, эти вычисления мощности не говорят нам ничего, что имеет непосредственное отношение к этому вопросу.
Я думаю, что вы решаете этот более полезный вопрос, заранее указав, что, по вашему мнению, «по сути, то же самое» означает на практике. Это - рационально направленное на статистическую деятельность - должно привести к содержательному анализу данных.
источник
Поскольку Колмогоров-Смирнов непараметрический, то по определению не может быть применимого анализа мощности. Чтобы получить какую-то оценку, вам нужно принять фоновую модель (и, таким образом, отклониться от непараметрического мира ...) и использовать ее для вычисления одного из следующих параметров: размер выборки, MDE или мощность (т. Е. Вы исправить / выбрать два и вычислить третий).
источник