Допустимо ли использовать две линейные модели на одном наборе данных?

10

Для линейной регрессии с несколькими группами (естественные группы определены априори) допустимо ли запускать две разные модели на одном наборе данных, чтобы ответить на следующие два вопроса?

  1. Есть ли в каждой группе ненулевой наклон и ненулевой перехват, и каковы параметры для каждой из них в рамках регрессии группы?

  2. Существует ли, независимо от членства в группе, ненулевой тренд и ненулевой перехват, и каковы параметры для этого в регрессии групп?

В R первая модель была бы lm(y ~ group + x:group - 1)так, чтобы оцененные коэффициенты могли быть непосредственно интерпретированы как пересечение и наклон для каждой группы. Вторая модель была бы lm(y ~ x + 1).

Альтернативой может быть то lm(y ~ x + group + x:group + 1), что приводит к сложной сводной таблице коэффициентов, причем внутри групповых уклонов и перехватов приходится рассчитывать из различий в уклонах и перехватах из некоторого эталона. Кроме того, вы все равно должны изменить порядок групп и запустить модель во второй раз, чтобы получить p-значение для последней разности групп (иногда).

Влияет ли это на две отдельные модели как-то негативно на вывод или на эту стандартную практику?

Чтобы поставить это в контекст, рассмотрим x как дозу лекарства, а группы - разные расы. Может быть интересно узнать отношение доза-ответ для конкретной расы у врача или для какой расы препарат работает вообще, но иногда может быть интересно узнать соотношение доза-ответ для всей (человеческой) популяции. независимо от гонки за чиновника общественного здравоохранения. Это всего лишь пример того, как можно интересоваться как внутри группы, так и между группами регрессий по отдельности. Вопрос о том, должны ли отношения доза-реакция быть линейными, не важен.

Jdub
источник
Вы уверены, что хотите использовать линейные регрессии? Отношения доза-ответ почти никогда не бывают линейными в значительном диапазоне доз.
Майкл Лью
@ Майкл, извини, я думаю, это был плохой выбор. Мне интересно об этом вообще. Подробности отношений доза-ответ не должны мешать. Я отредактировал вопрос, чтобы отметить это.
Jdub
Рассматривали ли вы случайный перехват, модель случайного наклона?
предполагается нормальным

Ответы:

2

-1+0lm(y ~ group + x:group - 1) +1гг-1Икссообщит вам, отличается ли наклон группы по умолчанию от 0, а термины взаимодействия сообщат, отличаются ли наклоны этих групп от групп по умолчанию. Тесты для уклонов других групп против 0 могут быть построены так же, как и для перехватов. Еще лучше было бы просто приспособить «ограниченную» модель без каких-либо переменных группового показателя или условий взаимодействия, и протестировать эту модель на основе полной модели anova(), которая скажет вам, действительно ли ваши группы существенно отличаются.

гг

Nгзнак равно0N

Я бы посоветовал вам следовать протоколу, который я изложил выше. А именно, фиктивный код вашей группы. Затем подберите полную модель со всеми макетами и условиями взаимодействия. Установите сокращенную модель без этих условий и выполните тест вложенной модели. Если группы как-то различаются, следуйте (надеюсь) априорным (теоретически управляемым) ортогональным контрастам, чтобы лучше понять, как группы различаются. (А сюжет - всегда, всегда сюжет.)

Gung - Восстановить Монику
источник