Я хочу выполнить анализ ANCOVA данных, касающихся плотности эпифитов растений. Сначала я хотел бы знать, есть ли какая-либо разница в плотности растений между двумя склонами, одним N и одним S, но у меня есть другие данные, такие как высота, открытость навеса и высота растения-хозяина. Я знаю, что моим ковариатом должны быть два склона (N и S). Я построил эту модель, которая работает на R, и хотя я понятия не имею, хорошо ли она работает. Также я хотел бы знать, в чем разница, если я использую символ +
или *
.
model1 <- aov(density~slope+altitude+canopy+height)
summary(model1)
model1
Ответы:
Основным инструментом для этого является
lm
; обратите внимание, чтоaov
это обертка дляlm
.В частности, если у вас есть некоторая группирующая переменная (фактор),g и непрерывный ковариат , модель будет соответствовать модели ANCOVA с основными эффектами, тогда как будет соответствовать модели, которая включает взаимодействие с ковариатой. будет принимать те же формулы.x
y ~ x + g
y ~ x * g
aov
Обратите особое внимание на
Note
помощь вaov
.Что касается
+
vs*
, russellpierce в значительной степени покрывает это, но я бы порекомендовал вам взглянуть?lm
и,?formula
и особенно, раздел 11.1 руководства Введение в R, которое идет с R (или вы можете найти его в Интернете, если вы не выяснили, как чтобы найти его на вашем компьютере, проще всего это найти выпадающее меню «Справка» в R или RStudio).источник
anova
(вы скоро увидите, что вы дадите их в неправильном порядке, потому что некоторые SS будут отрицательными, если вы это сделаете )Я рекомендую получать и читать Обнаружение статистики, используя R by Field. У него есть хороший раздел о ANCOVA.
Для запуска ANCOVA в R загрузите следующие пакеты:
Если вы используете
lm
илиaov
(я используюaov
), убедитесь, что вы устанавливаете контрасты с помощью функции "контрасты", прежде чем выполнять либоaov
илиlm
. По умолчанию R использует неортогональные контрасты, которые могут испортить все в ANCOVA. Если вы хотите установить ортогональные контрасты, используйте:затем запустите вашу модель как
Для просмотра модели используйте:
Убедитесь, что вы используете заглавную "А"
Anova
здесь, а неanova
. Это даст результаты с использованием типа III SS.summary.lm(model.1)
даст другое резюме и включает в себя R-кв. выход.Если вы хотите проверить однородность наклонов регрессии, вы также можете включить термин взаимодействия для IV и ковариата. Это было бы:
Если член взаимодействия является значительным, то у вас нет однородности.
источник
Вот дополнительная документация http://goo.gl/yxUZ1R процедуры, предложенной @Butorovich. Кроме того, мое наблюдение состоит в том, что когда ковариата является бинарной, использование сводки (lm.object) даст такую же оценку IV, как и сгенерированную Anova (lm.object, type = "III").
источник
ASK QUESTION
вверху и задав его там. Тогда мы можем помочь вам должным образом.Мы используем регрессионный анализ для создания моделей, которые описывают влияние изменения переменных предиктора на переменную ответа. Иногда, если у нас есть категориальная переменная со значениями, такими как Да / Нет или Мужской / Женский и т. Д., Простой регрессионный анализ дает несколько результатов для каждого значения категориальной переменной. В таком сценарии мы можем изучить влияние категориальной переменной, используя ее вместе с переменной-предиктором и сравнивая линии регрессии для каждого уровня категориальной переменной. Такой анализ называется анализ ковариантности, также называемый ANCOVA.
Пример
Рассмотрим
R
встроенный набор данныхmtcars
. В нем мы наблюдаем, что полеam
представляет тип передачи (автоматический или ручной). Это категориальная переменная со значениями 0 и 1. Отmpg
нее может зависеть и число миль на галлон ( ) автомобиля, помимо значения лошадиных сил (hp
). Мы изучаем влияние значенияam
на регрессию междуmpg
иhp
. Это делается с помощьюaov()
функции, за которой следуетanova()
функция, для сравнения нескольких регрессий.Ввод данных
Создание фрейма данных , содержащий поля
mpg
,hp
иam
из набора данныхmtcars
. Здесь мы беремmpg
переменную ответа, переменнуюhp
предиктора иam
категориальную переменную.Когда мы выполняем приведенный выше код, он дает следующий результат:
Анализ ANCOVA
Мы создаем регрессионную модель, принимающую
hp
в качестве переменной-предиктора и переменнойmpg
-отклика с учетом взаимодействия междуam
иhp
.Модель с взаимодействием между категориальной переменной и переменной предиктора
Создать регрессию модель1
Когда мы выполняем приведенный выше код, он дает следующий результат:
Этот результат показывает, что мощность в лошадиных силах и тип трансмиссии оказывают существенное влияние на мили на галлон, так как значение p в обоих случаях составляет менее 0,05. Но взаимодействие между этими двумя переменными не является значительным, так как значение р составляет более 0,05.
Модель без взаимодействия между категориальной переменной и предикторной переменной
Создать регрессионную модель2
Когда мы выполняем приведенный выше код, он дает следующий результат:
Этот результат показывает, что мощность в лошадиных силах и тип трансмиссии оказывают существенное влияние на мили на галлон, так как значение p в обоих случаях составляет менее 0,05.
Сравнение двух моделей
Теперь мы можем сравнить две модели, чтобы сделать вывод, является ли взаимодействие переменных действительно незначительным. Для этого мы используем
anova()
функцию.Поскольку значение р больше 0,05, мы заключаем, что взаимодействие между мощностью в лошадиных силах и типом передачи не является значительным. Таким образом, пробег на галлон будет аналогичным образом зависеть от мощности автомобиля как в автоматическом, так и в ручном режиме.
источник