Можно ли вычислить p-значения для корреляционного теста Пирсона только из коэффициента корреляции и размера выборки?

12

Предыстория: я прочитал одну статью, где авторы сообщают о корреляции Пирсона 0,754 от размера выборки 878. Результирующее значение p для корреляционного теста является значимым «две звезды» (т. Е. Р <0,01). Тем не менее, я думаю, что при таком большом размере выборки соответствующее значение p должно быть меньше 0,001 (т. Е. Значимость трех звезд).

  • Можно ли вычислить p-значения для этого теста только из коэффициента корреляции Пирсона и размера выборки?
  • Если да, то как это можно сделать в R?
Мирослав Сабо
источник
1
Для тех, кто заинтересован, вот онлайн калькулятор р-значения, который принимает r и n .
Джером Энглим

Ответы:

14

Да, это можно сделать, если вы используете преобразование R-to-z Фишера. Другие методы (например, начальная загрузка) могут иметь некоторые преимущества, но требуют исходных данных. В R ( r - коэффициент корреляции выборки, n - количество наблюдений):

z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2

Смотрите также этот пост в моем блоге .

Тем не менее, будь то .01 или .001 не имеет большого значения. Как вы сказали, это в основном функция размера выборки, и вы уже знаете, что размер выборки велик. Логический вывод заключается в том, что вам, вероятно, вообще не нужен тест (особенно не тест так называемой «нулевой» гипотезы о том, что корреляция равна 0). С N = 878 вы можете быть абсолютно уверены в точности оценки и сосредоточиться на ее интерпретации напрямую (т. Е. 0,75 велико в вашей области?).

Формально, однако, когда вы делаете статистический тест в структуре Неймана-Пирсона, вам нужно заранее указать уровень ошибки. Таким образом, если результаты теста действительно имеют значение, и исследование планировалось с пороговым значением 0,01, имеет смысл сообщать только о р <0,01, и вы не должны произвольно делать его р <0,001 в зависимости от полученного значения р . Этот тип нераскрытой гибкости является даже одной из основных причин критики маленьких звездочек, и в более общем плане того, как тестирование значимости нулевой гипотезы практикуется в социальных науках.

См. Также Meehl, PE (1978). Теоретические риски и табличные звездочки: сэр Карл, сэр Рональд и медленный прогресс в мягкой психологии. Журнал консалтинга и клинической психологии, 46 (4), 806-834. (Заголовок содержит ссылку на эти «звезды», но содержание представляет собой гораздо более широкое обсуждение роли проверки значимости.)

гала
источник
1
Я бы, вероятно, посоветовал им отказаться от маленьких звездочек, даже если результаты верны, но я понимаю вашу точку зрения.
Гала
1
Я отредактировал свой ответ, чтобы добавить замечание об этой проблеме. Обратите внимание, что 0,001 <0,01, так что авторы формально «правильны» в любом случае, это больше зависит от того, что подразумевается под результатами. Я думаю, что, в отличие от явной ошибки, которую рецензент, конечно, должен исправить, этот вопрос следует оставить на усмотрение авторов.
Гала
1
Вы правы, но до сих пор я никогда не видел сообщения о р <0,01, если р фактически меньше 0,001 (не говоря, что уровень достоверности для статьи равен 0,01). Более того, в статье, о которой я говорю, авторы сообщают о 30 корреляционных тестах, основанных на размерах выборки в диапазоне от 837 до 886, с корреляциями в диапазоне от 0,145 до 0,754, и все они отмечены как значащие две звезды.
Мирослав Сабо
1
У меня проблема с размещением моего кода здесь, но я запускаю симуляции, и p-значение из вашего кода не совпадает с p-значением из cor.test.
Мирослав Сабо
4
Я написал обзор учебника по использованию z Фишера для корреляций, доступный по адресу stata-journal.com/sjpdf.html?articlenum=pr0041. Я бы порекомендовал больше использовать доверительные интервалы и рассчитать 0,724, 0,781 как 95% -ные ограничения. Я бы порекомендовал еще больше посмотреть на данные и выработать регрессию.
Ник Кокс
2

Вы используете преобразование Фишера R-в-Z.

Есть альтернативная статистика:

abs(r)*sqrt((n-2)/(1-r^2)) ~ t.dist(d.f.=n-2)

это имеет t-распределение с n-2 степенями свободы. Вот как это работает, например: http://www.danielsoper.com/statcalc3/calc.aspx?id=44

Germaniawerks
источник