Когда люди применяют тесты перестановки для сравнения одной выборки со средним значением (например, как вы могли бы сделать с помощью t-критерия перестановки), как обрабатывается среднее значение? Я видел реализации, которые берут среднее и образец для теста перестановки, но неясно, что они на самом деле делают под капотом. Есть ли хотя бы осмысленный способ сделать перестановочный тест (например, t-тест) для одного образца в сравнении с предполагаемым средним значением? Или, в качестве альтернативы, они просто по умолчанию для неперестановочного теста под капотом? (например, несмотря на вызов функции перестановки или установку флага теста перестановки, по умолчанию используется стандартный t-тест или аналогичная функция)
В стандартном тесте перестановки с двумя выборками можно было бы иметь две группы и рандомизировать назначение меток. Однако как это обрабатывается, когда одна «группа» является предполагаемым средним значением? Очевидно, что предполагаемое среднее не имеет размера выборки само по себе. Итак, каков типичный способ преобразования среднего значения в формат перестановки? Предполагается, что «средняя» выборка представляет собой одну точку? Образец такого же размера, что и группа образцов? Образец бесконечного размера?
Учитывая, что предполагаемое среднее, ну, предполагается, я бы сказал, что технически оно имеет либо бесконечную поддержку, либо любую поддержку, которую вы хотите получить для него. Однако ни один из них не очень полезен для фактического вычисления. Образец одинакового размера со значениями, равными среднему, кажется тем, что иногда делают с некоторыми тестами (например, вы просто заполняете другую половину пар предполагаемым местоположением). Это имеет некоторый смысл, так как это образец равной длины, который вы увидите, если ваше предполагаемое среднее будет правильным без отклонений.
Поэтому мой вопрос заключается в следующем: на практике ли люди на самом деле эмулируют рандомизацию меток в стиле перестановочного теста, когда второй набор является средним (или аналогичным предполагаемым абстрактным значением)? Если да, то как люди справляются с рандомизацией меток, когда делают это?
источник
Ответы:
Расширение комментария Glen_b в ответ
Приближенный тест перестановки одной выборки для среднего значения выборки, против нулевой гипотезы нулевого среднего, реализуется путем присвоения случайных знаков данным в выборке. Ненулевые нулевые гипотезы могут быть проверены путем вычитания желаемого нулевого среднего из данных.
Это легко увидеть в источнике функции R
onetPermutation
в пакетеDAAG
. Вот выдержка из соответствующего кода с комментариями, которые я добавил:источник