Предыстория: я прочитал одну статью, где авторы сообщают о корреляции Пирсона 0,754 от размера выборки 878. Результирующее значение p для корреляционного теста является значимым «две звезды» (т. Е. Р <0,01). Тем не менее, я думаю, что при таком большом размере выборки соответствующее значение p должно быть меньше 0,001 (т. Е. Значимость трех звезд).
- Можно ли вычислить p-значения для этого теста только из коэффициента корреляции Пирсона и размера выборки?
- Если да, то как это можно сделать в R?
hypothesis-testing
correlation
p-value
fraud
Мирослав Сабо
источник
источник
Ответы:
Да, это можно сделать, если вы используете преобразование R-to-z Фишера. Другие методы (например, начальная загрузка) могут иметь некоторые преимущества, но требуют исходных данных. В R ( r - коэффициент корреляции выборки, n - количество наблюдений):
Смотрите также этот пост в моем блоге .
Тем не менее, будь то .01 или .001 не имеет большого значения. Как вы сказали, это в основном функция размера выборки, и вы уже знаете, что размер выборки велик. Логический вывод заключается в том, что вам, вероятно, вообще не нужен тест (особенно не тест так называемой «нулевой» гипотезы о том, что корреляция равна 0). С N = 878 вы можете быть абсолютно уверены в точности оценки и сосредоточиться на ее интерпретации напрямую (т. Е. 0,75 велико в вашей области?).
Формально, однако, когда вы делаете статистический тест в структуре Неймана-Пирсона, вам нужно заранее указать уровень ошибки. Таким образом, если результаты теста действительно имеют значение, и исследование планировалось с пороговым значением 0,01, имеет смысл сообщать только о р <0,01, и вы не должны произвольно делать его р <0,001 в зависимости от полученного значения р . Этот тип нераскрытой гибкости является даже одной из основных причин критики маленьких звездочек, и в более общем плане того, как тестирование значимости нулевой гипотезы практикуется в социальных науках.
См. Также Meehl, PE (1978). Теоретические риски и табличные звездочки: сэр Карл, сэр Рональд и медленный прогресс в мягкой психологии. Журнал консалтинга и клинической психологии, 46 (4), 806-834. (Заголовок содержит ссылку на эти «звезды», но содержание представляет собой гораздо более широкое обсуждение роли проверки значимости.)
источник
Есть альтернативная статистика:
это имеет t-распределение с n-2 степенями свободы. Вот как это работает, например: http://www.danielsoper.com/statcalc3/calc.aspx?id=44
источник