Я новичок в статистике, и в настоящее время я имею дело с ANOVA. Я провожу тест ANOVA в R, используя
aov(dependendVar ~ IndependendVar)
Я получаю, среди прочего, F-значение и p-значение.
Моя нулевая гипотеза ( ) состоит в том, что все групповые средства равны.
Существует много информации о том, как рассчитывается F , но я не знаю, как читать F-статистику и как связаны F и p.
Итак, мои вопросы:
- Как определить критическое значение F для отклонения ?
- У каждого F есть соответствующее значение p, таким образом они оба означают в основном то же самое? (например, если , то отклоняется)Н 0
r
anova
interpretation
Jand
источник
источник
summary(aov(dependendVar ~ IndependendVar)))
илиsummary(lm(dependendVar ~ IndependendVar))
? Вы имеете в виду, что все групповые средства равны друг другу и равны 0 или просто друг другу?summary(aov...)
. Спасибо заlm.*
, не знал об этом :-) Я не понимаю, что вы имеете в виду, имея значение 0. Если это коротко для моей 0-гипотезы, то гипотеза будет нуждаться в значении, а я не проверял конкретную, так и в этом случае: просто друг другу!Ответы:
Чтобы ответить на ваши вопросы:
Вы найдете критическое значение F из распределения F (вот таблица ). Смотрите пример . Вы должны быть осторожны в отношении односторонних и двухсторонних степеней свободы числителя и знаменателя.
Да.
источник
F статистика представляет собой отношение 2 различных показателей дисперсии для данных. Если нулевая гипотеза верна, то это обе оценки одной и той же вещи, и отношение будет около 1.
Числитель вычисляется путем измерения дисперсии средних значений, и если истинные средние значений групп идентичны, то это является функцией общей дисперсии данных. Но если нулевая гипотеза неверна, а средства не все равны, тогда эта мера дисперсии будет больше.
Знаменатель представляет собой среднее значение выборочных отклонений для каждой группы, которое является оценкой общей дисперсии населения (при условии, что все группы имеют равные отклонения).
Таким образом, когда null of all означает равный true, тогда 2 меры (с некоторыми дополнительными терминами для степеней свободы) будут похожими, и отношение будет близко к 1. Если null равно false, числитель будет большим по отношению к знаменатель и отношение будут больше 1. Просмотр этого отношения в F-таблице (или вычисление его с помощью функции, подобной pf в R) даст p-значение.
Если вы предпочитаете использовать область отклонения, а не значение p, то вы можете использовать таблицу F или функцию qf в R (или другом программном обеспечении). Распределение F имеет 2 типа степеней свободы. Степени свободы числителя основаны на количестве групп, которые вы сравниваете (для 1-стороннего числа это число минус 1), а степени свободы знаменателя основаны на количестве наблюдений в группах (для 1- так это количество наблюдений за вычетом количества групп). Для более сложных моделей степени свободы становятся более сложными, но следуют схожим идеям.
источник
Вы должны заметить несколько других вещей о распределении по нулевой гипотезе:
Это гораздо больше, чем я хотел набрать, но я надеюсь, что это затронет ваши вопросы!
(Если вам интересно, откуда появились диаграммы, они были автоматически сгенерированы моим пакетом статистики рабочего стола, Wizard .)
источник