Как интерпретировать F- и p-значение в ANOVA?

40

Я новичок в статистике, и в настоящее время я имею дело с ANOVA. Я провожу тест ANOVA в R, используя

aov(dependendVar ~ IndependendVar)

Я получаю, среди прочего, F-значение и p-значение.

Моя нулевая гипотеза ( ) состоит в том, что все групповые средства равны.H0

Существует много информации о том, как рассчитывается F , но я не знаю, как читать F-статистику и как связаны F и p.

Итак, мои вопросы:

  1. Как определить критическое значение F для отклонения ?H0
  2. У каждого F есть соответствующее значение p, таким образом они оба означают в основном то же самое? (например, если , то отклоняется)Н 0p<0.05H0
Jand
источник
1
Вы пробовали команды summary(aov(dependendVar ~ IndependendVar)))или summary(lm(dependendVar ~ IndependendVar))? Вы имеете в виду, что все групповые средства равны друг другу и равны 0 или просто друг другу?
RyanB
да, я попробовал summary(aov...). Спасибо за lm.*, не знал об этом :-) Я не понимаю, что вы имеете в виду, имея значение 0. Если это коротко для моей 0-гипотезы, то гипотеза будет нуждаться в значении, а я не проверял конкретную, так и в этом случае: просто друг другу!
JanD
1
Для интуитивного объяснения посмотрите блог Yhat на тему регрессии.
DataTx

Ответы:

14

Чтобы ответить на ваши вопросы:

  1. Вы найдете критическое значение F из распределения F (вот таблица ). Смотрите пример . Вы должны быть осторожны в отношении односторонних и двухсторонних степеней свободы числителя и знаменателя.

  2. Да.

dfrankow
источник
Не имеет смысла говорить об одно- или двухсторонних сравнениях в сводном тесте, таком как F-тест.
Маркус Морриси
3
Маркус Морриси: Я думаю, что вы путаете один с двумя хвостами с одним с двумя путями. F-тест не имеет нескольких «хвостов» на выбор, но при построении статистики теста необходимо учитывать односторонний ANOVA и двухсторонний ANOVA.
Эмиллер
29

F статистика представляет собой отношение 2 различных показателей дисперсии для данных. Если нулевая гипотеза верна, то это обе оценки одной и той же вещи, и отношение будет около 1.

Числитель вычисляется путем измерения дисперсии средних значений, и если истинные средние значений групп идентичны, то это является функцией общей дисперсии данных. Но если нулевая гипотеза неверна, а средства не все равны, тогда эта мера дисперсии будет больше.

Знаменатель представляет собой среднее значение выборочных отклонений для каждой группы, которое является оценкой общей дисперсии населения (при условии, что все группы имеют равные отклонения).

Таким образом, когда null of all означает равный true, тогда 2 меры (с некоторыми дополнительными терминами для степеней свободы) будут похожими, и отношение будет близко к 1. Если null равно false, числитель будет большим по отношению к знаменатель и отношение будут больше 1. Просмотр этого отношения в F-таблице (или вычисление его с помощью функции, подобной pf в R) даст p-значение.

Если вы предпочитаете использовать область отклонения, а не значение p, то вы можете использовать таблицу F или функцию qf в R (или другом программном обеспечении). Распределение F имеет 2 типа степеней свободы. Степени свободы числителя основаны на количестве групп, которые вы сравниваете (для 1-стороннего числа это число минус 1), а степени свободы знаменателя основаны на количестве наблюдений в группах (для 1- так это количество наблюдений за вычетом количества групп). Для более сложных моделей степени свободы становятся более сложными, но следуют схожим идеям.

Грег Сноу
источник
Спасибо за объяснение! Я предполагаю, что если я смогу найти значение F в таблице, чтобы увидеть значение p, то p и F - это всего лишь два способа выразить вероятность того, что результат, подобный анализируемому, может произойти, если H0 верен?
JanD
2
Во всей параметрической статистике существует прямая функциональная связь между статистикой теста (в данном случае F) и значением p. Они были помещены в таблицу для удобства, но также могут быть вычислены напрямую. Вы можете либо использовать альфа, чтобы найти предельное значение для критической области, чтобы сравнить статистику теста с (что я считаю более интуитивным), либо использовать вычисленную статистику теста, чтобы найти значение p для сравнения с альфа. В любом случае мы начинаем с альфа-уровня и формулы тестовой статистики, которая следует заданному распределению, когда значение равно нулю.
Грег Сноу,
20

Fп

введите описание изображения здесь

FFFpFFpFп

Вы должны заметить несколько других вещей о распределении по нулевой гипотезе:

F

F

ССFСппзнак равно0,175

FFdе1знак равно3dе1знак равно2

введите описание изображения здесь

Fχ2χ2Fχ2ZFTT

Это гораздо больше, чем я хотел набрать, но я надеюсь, что это затронет ваши вопросы!

(Если вам интересно, откуда появились диаграммы, они были автоматически сгенерированы моим пакетом статистики рабочего стола, Wizard .)

Emiller
источник