Для линейной регрессии с несколькими группами (естественные группы определены априори) допустимо ли запускать две разные модели на одном наборе данных, чтобы ответить на следующие два вопроса?
Есть ли в каждой группе ненулевой наклон и ненулевой перехват, и каковы параметры для каждой из них в рамках регрессии группы?
Существует ли, независимо от членства в группе, ненулевой тренд и ненулевой перехват, и каковы параметры для этого в регрессии групп?
В R первая модель была бы lm(y ~ group + x:group - 1)
так, чтобы оцененные коэффициенты могли быть непосредственно интерпретированы как пересечение и наклон для каждой группы. Вторая модель была бы lm(y ~ x + 1)
.
Альтернативой может быть то lm(y ~ x + group + x:group + 1)
, что приводит к сложной сводной таблице коэффициентов, причем внутри групповых уклонов и перехватов приходится рассчитывать из различий в уклонах и перехватах из некоторого эталона. Кроме того, вы все равно должны изменить порядок групп и запустить модель во второй раз, чтобы получить p-значение для последней разности групп (иногда).
Влияет ли это на две отдельные модели как-то негативно на вывод или на эту стандартную практику?
Чтобы поставить это в контекст, рассмотрим x как дозу лекарства, а группы - разные расы. Может быть интересно узнать отношение доза-ответ для конкретной расы у врача или для какой расы препарат работает вообще, но иногда может быть интересно узнать соотношение доза-ответ для всей (человеческой) популяции. независимо от гонки за чиновника общественного здравоохранения. Это всего лишь пример того, как можно интересоваться как внутри группы, так и между группами регрессий по отдельности. Вопрос о том, должны ли отношения доза-реакция быть линейными, не важен.
Ответы:
-1
+0
lm(y ~ group + x:group - 1)
+1
anova()
, которая скажет вам, действительно ли ваши группы существенно отличаются.Я бы посоветовал вам следовать протоколу, который я изложил выше. А именно, фиктивный код вашей группы. Затем подберите полную модель со всеми макетами и условиями взаимодействия. Установите сокращенную модель без этих условий и выполните тест вложенной модели. Если группы как-то различаются, следуйте (надеюсь) априорным (теоретически управляемым) ортогональным контрастам, чтобы лучше понять, как группы различаются. (А сюжет - всегда, всегда сюжет.)
источник