При проверке некоторых нулевых и альтернативных гипотез с помощью тестовой статистики , где , примените тест перестановки с набором перестановок на и мы получим новую статистику Х = { х я , . , , , x n } G X T ( X ) : = # { π ∈ G : U ( π X ) ≥ U ( X ) }
Какая польза от использования теста перестановки по сравнению с неиспользованием теста? Т.е. каково это, когда работает тест перестановки?
Какие условия для этого? Например, какие-нибудь условия для тестовой статистики и / или нулевой гипотезы?
Например,
Должно ли быть равным p-значению на основе для выборки ? Если да, то почему? (ссылки также приветствуются)U ( X ) X
Значение p для определяется как . Если тест перестановки предназначен для оценки распределения перестановок U (X) | X = x , как T (X) равен p-значению U (X) в X = x ? В частности, в нулевом H может быть несколько распределений , и T (X) не учитывает нулевые распределения по одному, а затем принимает \ sup_ {F \ in H} и \ inf_ {c: U (x) \ geq c} .U(X) | X=xT(X)U(X)X=xHT(X) sup F ∈ H
Должен ли тест перестановки сделать свободным от распределения по нулевым гипотезам? В каких условиях это произойдет?
Должно ли быть равномерно распределено по ? В каких условиях это произойдет? Обратите внимание, что когда является постоянной функцией, T (\ cdot) также постоянна в 1, а распределение T (X) далеко не равномерно по [0,1] .[ 0 , 1 ] U ( ⋅ ) T ( ⋅ ) 1 T ( X ) [ 0 , 1 ]
Спасибо и всего наилучшего!
Ответы:
Поскольку обсуждение продолжалось долго, я взял свои ответы на ответ. Но я изменил порядок.
Тесты перестановок являются «точными», а не асимптотическими (сравните, например, с тестами отношения правдоподобия). Так, например, вы можете выполнить проверку средних, даже не имея возможности вычислить распределение разницы в средних при нулевом значении; вам даже не нужно указывать соответствующие дистрибутивы. Вы можете создать тестовую статистику, которая будет иметь хорошую мощность при наборе допущений, не будучи настолько чувствительной к ним, как полностью параметрическое допущение (вы можете использовать статистику, которая является надежной, но имеет хорошую ARE).
Обратите внимание, что определения, которые вы даете (или, скорее, те, кого вы цитируете там), не являются универсальными; некоторые люди называют U статистикой теста на перестановку (что делает тест на перестановку не статистикой, а тем, как вы оцениваете p-значение). Но как только вы делаете тест на перестановку и назначаете направление, поскольку «крайние значения этого несовместимы с H0», такое определение для T, приведенное выше, в основном показывает, как вы работаете с p-значениями - это просто фактическая пропорция распределение перестановок по крайней мере так же экстремально, как и выборка под нулем (само определение p-значения).
Так, например, если я хочу провести (односторонний, для простоты) тест средств, такой как t-тест с двумя выборками, я мог бы сделать свою статистику числителем t-статистики или самой t-статистикой, или сумма первого образца (каждое из этих определений является монотонным в других, обусловленное объединенным образцом), или любое их монотонное преобразование, и имеют одинаковый тест, поскольку они дают идентичные значения р. Все, что мне нужно сделать, - это увидеть, как далеко (в пропорциях) находится распределение перестановок любой статистики, которую я выбираю. T, как определено выше, это просто еще одна статистика, такая же хорошая, как и любая другая, которую я могу выбрать (T, как определено, монотонен в U).
T не будет точно однородным, потому что это потребует непрерывных распределений, а T обязательно дискретно. Поскольку U и, следовательно, T могут отображать более одной перестановки в данную статистику, результаты не являются равновероятными, но они имеют «подобный» cdf **, но тот, где шаги не обязательно равны по размеру ,
** ( , и строго равно ему в правом пределе каждого прыжка - вероятно, есть название того, что это на самом деле)F(x)≤x
Для разумной статистики, когда стремится к бесконечности, распределение приближается к однородности. Я думаю, что лучший способ начать понимать их - это делать их в самых разных ситуациях.n T
T - значение p (для случаев, когда большое U указывает отклонение от нуля, а маленькое U соответствует ему). Обратите внимание, что распределение зависит от выборки. Таким образом, его распространение не «для любого образца».
Я уже объяснил, что Т не является равномерным.
Я думаю, что я уже объяснил, что я вижу в преимуществах тестов перестановки; другие люди предложат другие преимущества ( например ).
В предложении, которое вы процитировали, прямо говорится, что T - это p-значение, и когда это так. Если вы можете объяснить, что неясно по этому поводу, возможно, я мог бы сказать больше. Что касается того, почему, смотрите определение p-значения (первое предложение по ссылке) - это довольно прямо следует из этого
Там хорошее элементарное обсуждение перестановок тестов здесь .
-
Редактировать: я добавляю здесь небольшой пример теста перестановки; этот (R) код подходит только для небольших выборок - вам нужны лучшие алгоритмы для нахождения экстремальных комбинаций в умеренных выборках.
Рассмотрим тест на перестановку в отношении односторонней альтернативы:
* но я обычно избегаю этого, потому что это, как правило, приводит к путанице среди студентов, когда они пытаются разработать нулевые дистрибутивы.
по следующим данным:
Существует 35 способов разделения 7 наблюдений на выборки размером 3 и 4:
Как упоминалось ранее, учитывая 7 значений данных, сумма первой выборки является монотонной по разнице в средних значениях, поэтому давайте использовать ее как статистику теста. Таким образом, исходный образец имеет тестовую статистику:
Теперь вот распределение перестановок:
(Не обязательно сортировать их, я просто сделал это, чтобы было легче увидеть статистику теста, которая была вторым значением с конца.)
Мы можем видеть (в данном случае проверкой), что равно 2/35, илиp
(Обратите внимание, что только в случае отсутствия перекрытия по xy p-значение здесь ниже .05 возможно. В этом случае будет дискретно равномерным, потому что в нет связанных значений .)T U
Розовые стрелки указывают статистику выборки на оси x и значение p на оси y.
источник