Я хотел бы проверить разницу в ответе двух переменных на один предиктор. Вот минимальный воспроизводимый пример.
library(nlme)
## gls is used in the application; lm would suffice for this example
m.set <- gls(Sepal.Length ~ Petal.Width, data = iris,
subset = Species == "setosa")
m.vir <- gls(Sepal.Length ~ Petal.Width, data = iris,
subset = Species == "virginica")
m.ver <- gls(Sepal.Length ~ Petal.Width, data = iris,
subset = Species == "versicolor")
Я вижу, что коэффициенты наклона разные:
m.set$coefficients
(Intercept) Petal.Width
4.7771775 0.9301727
m.vir$coefficients
(Intercept) Petal.Width
5.2694172 0.6508306
m.ver$coefficients
(Intercept) Petal.Width
4.044640 1.426365
У меня три вопроса:
- Как я могу проверить разницу между склонами?
- Как я могу проверить разницу между остаточными отклонениями?
- Какой простой и эффективный способ представить эти сравнения?
Смежный вопрос, « Метод сравнения переменных коэффициентов в двух регрессионных моделях» , предлагает повторно запустить модель с фиктивной переменной для дифференциации уклонов. Существуют ли варианты, позволяющие использовать независимые наборы данных?
Ответы:
Как я могу проверить разницу между склонами?
Включите манекен для видов, дайте ему взаимодействовать с и посмотрите, ли этот манекен. Пусть - длина чашелистика, - ширина педали, а - фиктивные переменные для трех видов. Сравнить модельL i P i S 1 , S 2 , S 3пя Lя пя S1, S2, S3
с моделью, которая позволяет эффекту быть различным для каждого вида:пя
Оценщики GLS являются MLE, а первая модель является подмоделью второй, поэтому вы можете использовать здесь тест отношения правдоподобия. Вероятности можно извлечь с помощью4 4
logLik
функции, и степени свободы для теста будут равны поскольку вы удалили параметра, чтобы получить подмодель.4Какой простой и эффективный способ представить сравнение?
Я думаю, что наиболее привлекательным способом было бы построить линии регрессии для каждого вида на одних и тех же осях, возможно, с помощью столбцов ошибок, основанных на стандартных ошибках. Это сделало бы разницу (или отсутствие различий) между видами и их отношением к очень очевидной.пя
Изменить: я заметил еще один вопрос был добавлен в тело. Итак, я добавляю ответ на это:
Как я могу проверить разницу между остаточными отклонениями?
Для этого вам нужно будет расслоить набор данных и подогнать отдельные модели, поскольку предложенная мной модель взаимодействия будет ограничивать остаточную дисперсию одинаковой в каждой группе. Если вы подходите отдельным моделям, это ограничение исчезнет. В этом случае вы все равно можете использовать тест отношения правдоподобия (вероятность для более крупной модели теперь рассчитывается путем суммирования правдоподобия из трех отдельных моделей). «Нулевая» модель зависит от того, с чем вы хотите сравнить ее
если вы хотите только проверить дисперсию, оставив основные эффекты в ней, то «нулевой» моделью должна быть модель с взаимодействиями, которые я написал выше. Степени свободы для теста равны .2
Если вы хотите проверить дисперсию вместе с коэффициентами, тогда нулевая модель должна быть первой моделью, которую я написал выше. Степень свободы для теста составляет .6
источник
gls(Sepal.Length ~ species:Petal.Width, data = iris)
species
gls(Sepal.Length ~ species*Petal.Width, data=iris)
gls
модели, но с учетом различных остаточных отклонений для каждого вида с опциейweights=varIdent(form=~1|Species)
(относительно второго вопроса)?Чтобы ответить на эти вопросы с помощью кода R, используйте следующее:
1. Как я могу проверить разницу между уклонами?
Ответ: Изучите p-значение ANOVA из взаимодействия Petal.Width по видам, затем сравните наклоны, используя lsmeans :: lstrends, следующим образом.
2. Как я могу проверить разницу между остаточными отклонениями?
Если я понимаю вопрос, вы можете сравнить корреляции Пирсона с преобразованием Фишера, также называемым «r-to-z» Фишера, следующим образом.
3. Какой простой и эффективный способ представить эти сравнения?
«Мы использовали линейную регрессию для сравнения соотношения длины чашелистика и ширины лепестка для каждого вида. Мы не обнаружили существенного взаимодействия в соотношениях длины чашечки и ширины лепестка для I. Setosa (B = 0,9), I. Versicolor (B = 1,4), ни I. Virginica (B = 0,6); F (2, 144) = 1,6, p = 0,19. Сравнение r-to-z Фишера показало, что корреляция Пирсона для I. Setosa (r = 0.28) была значительно ниже (р = 0,02), чем I. Versicolor (r = 0,55). Аналогично, корреляция для I. Virginica (r = 0,28) была значительно слабее (p = 0,02), чем корреляция, наблюдаемая для I. Versicolor«.
Наконец, всегда визуализируйте свои результаты!
источник
Я согласен с предыдущим предложением. Вы должны установить модель множественной регрессии с фиктивной переменной для каждого набора данных. Это позволит вам проверить, отличаются ли перехваты. Если вы также хотите узнать, отличаются ли уклоны , то вам также необходимо включить взаимодействия между манекенами и рассматриваемой переменной. Нет проблем с тем, что данные независимы. Обратите внимание, что если оба они являются независимыми и (например) разными видами, то вы не сможете определить, связано ли обнаруженное вами различие с разными видами или различными наборами данных, поскольку они совершенно запутаны. Тем не менее, нет теста / карта без выхода из тюрьмы, которая поможет вам решить эту проблему без сбора нового образца и повторного проведения исследования.
источник