Я хочу проверить выборочную корреляцию на значимость, используя p-значения, то есть
Я понял, что могу использовать z-преобразование Фишера для вычисления
и найти значение р по
используя стандартное нормальное распределение.
Мой вопрос: насколько велико должно быть чтобы это было подходящим преобразованием? Очевидно, должно быть больше 3. Мой учебник не упоминает никаких ограничений, но на слайде 29 этой презентации говорится, что должно быть больше 10. Для данных, которые я буду рассматривать, у меня будет что-то вроде .н5 ≤ n ≤ 10
correlation
sample-size
fisher-transform
Гуннхильд
источник
источник
Ответы:
Для подобных вопросов я бы просто запустил симуляцию и посмотрел, ведут ли себя как я ожидаю. Значение - это вероятность случайного выбора образца, который отклоняется от нулевой гипотезы как минимум на столько же, сколько от данных, которые вы наблюдали, если нулевая гипотеза верна. Таким образом, если бы у нас было много таких выборок, а у одного из них было значение 0,04, то мы ожидали бы, что 4% из этих образцов будут иметь значение менее 0,04. То же самое верно для всех других возможных значений.р р рp p p p
Ниже приведено моделирование в Stata. Графики проверяют, измеряют ли то, что они должны измерять, то есть они показывают, насколько доля выборок с меньше номинального значения отклоняется от номинального значения. Как видите, этот тест несколько проблематичен при таком небольшом количестве наблюдений. Является ли это слишком проблематичным для вашего исследования, является вашим суждением.р р рp p p p
источник
FWIW Я вижу рекомендацию в Myers & Well (дизайн исследования и статистический анализ, второе издание, 2003, стр. 492). Сноска гласит:N≥10
источник
Не уверен, подходит ли здесь преобразование Фишера . Для H 0 : ρ = 0 (примечание: нулевая гипотеза относится к совокупности ρ , а не к выборке r ), распределение выборки коэффициента корреляции уже симметрично, поэтому нет необходимости уменьшать асимметрию, что и стремится Фишера z , и Вы можете использовать т приближение Стьюдента .z H0:ρ=0 ρ r z t
Справедливо мнение Ника: аппроксимации и рекомендации всегда действуют в какой-то серой зоне.
источник