(Чтобы сделать наши представления немного более точными, давайте назовем «тестовую статистику» распределением того, что мы ищем, чтобы фактически вычислить p-значение. Это означает, что для двустороннего t-теста наша тестовая статистика будет | T| а не T )
Что делает тестовая статистика , так это вызывать упорядочение в пространстве выборки (или, точнее, частичное упорядочение), чтобы вы могли определить крайние случаи (те, которые наиболее соответствуют альтернативе).
В случае точного теста Фишера, в некотором смысле уже есть порядок - вероятности самих таблиц 2х2. Как это происходит, они соответствуют порядку на в том смысле, что либо самые большие, либо самые маленькие значения являются «экстремальными», и они также являются значениями с наименьшей вероятностью. Поэтому вместо того, чтобы смотреть на значения так, как вы предлагаете, можно просто работать с больших и малых концов, на каждом шаге просто добавляя любое значение (наибольшее или наименьшееИкс1 , 1Икс1 , 1Икс1 , 1Икс1 , 1-значение, которого там еще нет) имеет наименьшую вероятность, связанную с ним, и продолжается до тех пор, пока вы не достигнете своей наблюдаемой таблицы при его включении общая вероятность всех этих крайних таблиц является p-значением.
Вот пример:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
Первый столбец - значения , второй столбец - вероятности, а третий столбец - индуцированный порядок.Икс1 , 1
Таким образом, в конкретном случае точного теста Фишера вероятность каждой таблицы (эквивалентно каждому значению ) может рассматриваться как фактическая статистика тестаИкс1 , 1 .
Если вы сравните предложенную статистику тестав этом случае он вызывает такое же упорядочение (и я полагаю, что это происходит в целом, но я не проверял), поскольку большие значения этой статистики являются меньшими значениями вероятности, поэтому его можно в равной степени считать «статистикой». - но так же могут быть и многие другие величины - в действительности, любые, которые сохраняют это упорядочение во всех случаях, являются эквивалентной статистикой теста, потому что они всегда дают одинаковые p-значения.| Икс1 , 1- μ |Икс1 , 1
Икс1 , 1
[Редактировать: некоторые программы предоставляют статистику теста для теста Фишера; Я предполагаю, что это будет вычисление типа -2logL, которое будет асимптотически сопоставимо с хи-квадратом. Некоторые могут также представить отношение шансов или его журнал, но это не совсем эквивалентно.]
источник
На самом деле его нет. Тестовая статистика - это историческая аномалия - единственная причина, по которой у нас есть тестовая статистика, - это получить значение p. Точный тест Фишера перепрыгивает статистику теста и переходит прямо к p-значению.
источник