Хорошо известно, что асимптотическая относительная эффективность (ARE) критерия Уилкоксона со знаком ранга равна по сравнению стстудента , если данные получены из нормально распределенной популяции. Это верно как для базового теста с одним образцом, так и для варианта с двумя независимыми образцами (Уилкоксон-Манн-Уитни U). Это также АР теста Крускала-Уоллиса по сравнению с ANOVA F -тестом для нормальных данных.
Есть ли у этого замечательного (для меня, одного из « самых неожиданных явлений ») и удивительно простого результата проницательное, замечательное или простое доказательство?
Ответы:
Краткий эскиз ARE дляt теста с одним образцом , подписанный тест и тест со знаком ранга
Я ожидаю, что длинная версия ответа @ Glen_b включает в себя подробный анализ теста с двумя выборками со знаком ранга и интуитивное объяснение ARE. Поэтому я пропущу большую часть вывода. (случай с одним образцом, вы можете найти недостающие детали в Lehmann TSH).
Задача тестирования : ПустьX1,…,Xn - случайная выборка из модели местоположения f(x−θ) , симметричная относительно нуля. Мы должны вычислить ARE знакового теста, знакового рангового теста для гипотезы H0:θ=0 относительно t-критерия.
Чтобы оценить относительную эффективность тестов, рассматриваются только локальные альтернативы, потому что последовательные тесты имеют тенденцию к 1 против фиксированной альтернативы. Локальные альтернативы, которые приводят к нетривиальной асимптотической степени, часто имеют вид для фиксированногоh, которыйв некоторых литературахназываетсядрейфом Питмана.θn=h/n−−√ h
Наша задача впереди
Проверка статистики и асимптотики
Следовательно, A
Замечание о выводе распределения по альтернативе
Есть, конечно, много способов получить предельное распределение по альтернативе. Один общий подход заключается в использовании третьей леммы Ле Кама. Упрощенная версия этого гласит
For quadratic mean differentiable densities, local asymptotic normality and contiguity are automatically satisfied, which in turn implies Le Cam lemma. Using this lemma, we only need to computecov(Wn,Δn) under the null. Δn obeys LAN
источник
This has nothing to do with explaining whyπ appears (which was explained nicely by others) but may help intuitively. The Wilcoxon test is a t -test on the ranks of Y whereas the parametric test is computed on the raw data. The efficiency of the Wilcoxon test with respect to the t -test is the square of the correlation between the scores used for the two tests. As n→∞ the squared correlation converges to π3 . You can easily see this empirically using R:
источник
n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2
(which obviously produces the same result)?Short version: The basic reason with the Wilcoxon-Mann-Whitney under a shift alternative is that finding the asymptotic relative efficiency (WMW/t) corresponds to evaluating12σ2[∫f2(x)dx]2 where f is the common density at the null and σ is the common variance.
So at the normal,f2 is effectively a scaled version of f ; its integral will have a 1π√ term; when squared, that's the source of the π .
The same term - with the same integral - is involved in the ARE for the signed rank test, so it takes the same value.
For the sign test relative to t, the ARE is4σ2f(0)2 ... and f(0)2 again has a π in it.
So essentially it's as I said in comments;π is in the ARE for the Wilcoxon-Mann-Whitney vs the two-sample t test, for the Wilcoxon signed rank test vs the one-sample t and the sign test vs the one-sample t test (in each case at the normal) quite literally because it appears in the normal density.
Reference:
J. L. Hodges and E. L. Lehmann (1956),
"The Efficiency of Some Nonparametric Competitors of the t-Test",
Ann. Math. Statist., 27:2, 324-335.
источник