В чем разница между Z-показателями и p-значениями?

11

В алгоритмах сетевых мотивов довольно часто возвращают как значение p, так и Z-показатель для статистики: «Входная сеть содержит X копий подграфа G». Подграф считается мотивом, если он удовлетворяет

  • р-значение <А,
  • Z-оценка> B и
  • X> C, для некоторых пользовательских (или определенных сообществом) A, B и C.

Это мотивирует вопрос:

Вопрос : Каковы различия между p-значением и Z-счетом?

И подвопрос:

Вопрос : Существуют ли ситуации, когда p-значение и Z-оценка одной и той же статистики могут предполагать противоположные гипотезы? Являются ли первое и второе перечисленные выше условия практически одинаковыми?

Дуглас С. Стоунс
источник

Ответы:

9

Исходя из вашего вопроса, я бы сказал, что между этими тремя тестами нет никакой разницы. Это в том смысле, что вы всегда можете выбрать A, B и C, чтобы одно и то же решение было принято независимо от того, какой критерий вы используете. Хотя вам нужно, чтобы значение p было основано на той же статистике (то есть Z-оценка)

Для использования Z-показателя предполагается , что среднее значение и дисперсия σ 2 известны, а распределение считается нормальным (или асимптотически / приблизительно нормальным). Предположим, что критерий p-значения обычно составляет 5%. Тогда мы имеем:μσ2

пзнак равнопр(Z>Z)<0,05Z>1,645Икс-μσ>1,645Икс>μ+1,645σ

Таким образом, у нас есть тройка которые представляют одинаковые срезы .(0,05,1,645,μ+1,645σ)

Обратите внимание, что такая же корреспонденция будет применяться к t-критерию, хотя цифры будут другими. Тест с двумя хвостами также будет иметь аналогичное соответствие, но с разными номерами.

probabilityislogic
источник
Спасибо за это! (и спасибо другим ответчикам тоже).
Дуглас С. Стоунс
8

-score описывает ваше отклонение от среднего в единицах стандартного отклонения. Не ясно, принимаете ли вы или отклоняете свою нулевую гипотезу.Z

Значение - это вероятность того, что при нулевой гипотезе мы могли бы наблюдать точку, столь же экстремальную, как и ваша статистика. Это явно говорит вам, отклоняете ли вы или принимаете свою нулевую гипотезу при заданном размере теста α .пα

Рассмотрим пример, где и нулевая гипотеза µ = 0 . Тогда вы наблюдаете х 1 = 5 . Ваш Z-показатель равен 5 (что говорит только о том, насколько далеко вы отклоняетесь от своей нулевой гипотезы в терминах σ ), а ваше p- значение равно 5.733e-7. Для достоверности 95% у вас будет тестовый размер α = 0,05, и, поскольку p < α, вы отвергаете нулевую гипотезу. Но для любой данной статистики должен быть некоторый эквивалент А иXN(μ,1)μ=0x1=5Zσpα=0.05p<αA таком, что тесты одинаковы.B

Gary
источник
3
@Gary - p-значение не говорит вам отклонить или нет, больше, чем Z-оценка. Они просто цифры. Только правило принятия решения определяет принятие или отклонение. Это правило решение может одинаково хорошо быть определены в терминах Z-балла (например, или 3 σ правило)2σ3σ
probabilityislogic
@probabilityislogic Я согласен с тобой. В самом деле, вы можете построить некоторый тест, основанный на пороге баллов, но он не позволяет вам явно определить размер теста в классическом смысле (то есть с точки зрения вероятности). Такой критерий может быть проблемой, если у вашего дистрибутива толстые хвосты. Когда вы создаете тест, вы явно определяете размер теста, и, таким образом, значение p немедленно сообщает вам, принимаете ли вы или отклоняете, что я и пытался сделать. Zп
Гэри
@gary - не совсем, поскольку значение p не содержит ссылок на альтернативы. Поэтому его нельзя использовать для прямого сравнения альтернатив. Например, возьмем против H A : μ = - 1 . Значение p для H 0 остается тем же 5 × 10 - 7 . Таким образом, вы говорите «отклонить нуль», что означает «принять альтернативу» и объявить μ = - 1H0:μ=0HA:μ=1H05×107μ=1, Но это абсурд, никто бы этого не сделал, но здесь используется правило p-значения, которое вы здесь используете. Другими словами, описанное вами правило p-значения не является инвариантным по отношению к тому, что называется «нулевой гипотезой» (принятие резолюции)
вероятностное
(продолжение) Разрешение кажущегося абсурда заключается в том, что значение p является не «абсолютным», а относительным критерием, определенным неявной альтернативной гипотезой. В этом случае неявной альтернативой является . Вы можете увидеть это, заметив, что если я вычислю p-значение H A, я получу 1 × 10 - 9 , что меньше, чем p-значение для H 0 . Теперь в этом примере «неявная альтернатива» легко найти с помощью интуиции, но ее гораздо сложнее найти в более сложных задачах, где имеются неприятные параметры или отсутствует достаточная статистика. ЧАСямп:μзнак равно5ЧАСA1×10-9ЧАС0
probabilityislogic
1
@Gary - р-значение не более строгое только потому, что это вероятность. Это монотонное преобразование Z-показателя 1: 1. любая «строгость», которой обладает p-значение, также присуща Z-шкале. Хотя, если вы используете двусторонний тест, то эквивалентом является абсолютное значение Z-показателя. И чтобы сравнить с нулевым значением, вы должны использовать «минимаксный» подход: выбрать точную гипотезу, которая больше всего подтверждается данными и согласуется с H 1 . Если вы не можете продемонстрировать, как рассчитать P ( X | μ 1 )ЧАС1:μ0ЧАС1п(Икс|μ1)
вероятностный логический
6

pZ

пZZп

Шелдон Купер
источник
если размер выборки большой, то стандартное отклонение будет небольшим, следовательно, Z-показатель будет высоким. Я думаю, что вы можете обнаружить это, если вы попробовали числовой пример.
вероятностная
1
На самом деле, нет. Предположим, вы выбрали N (0, 1). Тогда ваше стандартное значение будет около 1 независимо от размера выборки. Что станет меньше, так это стандартная ошибка среднего, а не стандартное отклонение. Значения p основаны на SEM, а не на std.
SheldonCooper
Z-оценка (наблюдаемое среднее) / (стандартное отклонение). Но среднее значение и стандартное отклонение относятся к наблюдаемой статистике, а не к населению, из которого она была составлена. Моя слабая терминология была поймана здесь. Однако, если вы проверяете среднее значение, то подходящее стандартное отклонение в Z-значении является стандартной ошибкой, которая уменьшается с той же скоростью, что и p-значение.
вероятностная