Тесты перестановок - это тесты значимости, основанные на повторных выборках перестановок, взятых случайным образом из исходных данных. Образцы перестановки составляются без замены, в отличие от образцов начальной загрузки, которые составляются с заменой. Вот пример, который я сделал в R простого теста перестановки. (Ваши комментарии приветствуются)
Тесты перестановок имеют большие преимущества. Они не требуют определенных форм населения, таких как нормальность. Они применимы к различным статистическим данным, а не только к статистическим данным, которые имеют простое распределение по нулевой гипотезе. Они могут давать очень точные значения р, независимо от формы и размера популяции (если используется достаточное количество перестановок).
Я также читал, что часто полезно дать доверительный интервал вместе с тестом, который создается с использованием повторной выборки при начальной загрузке, а не повторной выборки при перестановке.
Не могли бы вы объяснить (или просто дать код R), как строится доверительный интервал (т.е. для разницы между средними значениями двух выборок в приведенном выше примере)?
РЕДАКТИРОВАТЬ
После некоторого поиска в Google я нашел это интересное чтение .
источник
sample
иreplace=TRUE
? Есть ли причина использовать пакет какboot
?sum(b$t>=b$t0)/b$R
Поскольку тест перестановки является точным тестом, он дает вам точное значение p. Начальная загрузка теста перестановки не имеет смысла.
Кроме того, определение доверительного интервала вокруг тестовой статистики также не имеет смысла, так как оно рассчитывается на основе вашей выборки, а не оценки. Вы определяете доверительные интервалы по оценкам, таким как средние значения и лайки, но не по статистике теста
Тесты перестановок не должны использоваться для наборов данных, которые настолько велики, что вы не можете больше рассчитывать все возможные перестановки. Если это так, используйте процедуру начальной загрузки, чтобы определить отсечение для используемой вами статистики теста. Но опять же, это не имеет ничего общего с 95% доверительным интервалом.
Пример: я использую здесь классическую Т-статистику, но использую простой подход к начальной загрузке для расчета эмпирического распределения моей статистики. На основании этого я вычисляю эмпирическое значение p:
Примите во внимание, что это двустороннее тестирование работает только для симметричных распределений. Несимметричные распределения обычно проверяются только в одностороннем порядке.
РЕДАКТИРОВАТЬ :
ОК, я неправильно понял вопрос. Если вы хотите рассчитать доверительный интервал для оценки разницы, вы можете использовать код, упомянутый здесь, для начальной загрузки в каждом образце. Имейте в виду, это предвзятая оценка: обычно это дает CI, который является слишком маленьким. Также см. Приведенный там пример как причину, по которой вы должны использовать другой подход для доверительного интервала и значения p.
источник
x[6:11]
ссылка на аргументx
анонимной функции в приложении. Может быть, сбивает с толку, но ваши изменения дали очень неправильные результаты Пожалуйста, прокомментируйте, что, по вашему мнению, должно быть до редактирования кода. Спасает меня откат. Чтобы избежать дальнейшей путаницы, я изменил этоx
наi
Из кода Joris Meys в Ответах, но с изменениями, позволяющими применять его в более чем одной ситуации:
Я попытался отредактировать другой, но у меня не было времени закончить, и по какой-то причине я не могу комментировать (возможно, потому что это старый вопрос).
источник