Как интерпретировать основные эффекты, когда эффект взаимодействия незначителен?

21

Я запустил обобщенную линейную смешанную модель в R и включил эффект взаимодействия между двумя предикторами. Взаимодействие не было значительным, но основные эффекты (два предиктора) были оба. Теперь многие примеры из учебников говорят мне, что, если взаимодействие имеет существенный эффект, основные эффекты не могут быть интерпретированы. Но что, если ваше взаимодействие не имеет значения?

Могу ли я сделать вывод, что два предиктора влияют на ответ? Или лучше запустить новую модель, где я исключаю взаимодействие? Я предпочитаю не делать этого, потому что тогда мне придется контролировать множественное тестирование.

rozemarijn
источник
да, я имел в виду, не имеет значения
rozemarijn
4
Если один из этих ответов вам подходит, возможно, вы примете его или попросите разъяснений.
conjugateprior
Если взаимодействие не имеет существенного значения, вы должны отбросить его и запустить регрессию без него.
Аксакал

Ответы:

21

Немного прищемить

«Теперь многие примеры из учебников говорят мне, что, если взаимодействие имеет существенный эффект, основные эффекты не могут быть интерпретированы»

Я надеюсь, что это не так. Они должны сказать, что если существует член взаимодействия, скажем, между X и Z, называемый XZ, то интерпретация отдельных коэффициентов для X и для Z не может интерпретироваться так же, как если бы XZ не присутствовал. Вы можете определенно интерпретировать это.

вопрос 2

Если взаимодействие имеет теоретический смысл, то нет причин не оставлять его, если только соображения статистической эффективности по какой-то причине не перевешивают опасения по поводу неправильной спецификации и не позволяют вашей теории и вашей модели расходиться.

Учитывая , что вы уже оставили его, а затем интерпретировать вашу модель , используя краевые эффекты таким же образом , как если бы взаимодействие было значительным. Для справки я включил ссылку на Brambor, Clark and Golder (2006), в которой объясняется, как интерпретировать модели взаимодействия и как избежать распространенных ошибок.

Подумайте об этом так: у вас часто есть контрольные переменные в модели, которые оказываются несущественными, но вы не должны (или не должны) вырезать их при первых признаках пропущенных звезд.

Вопрос 1

Вы спрашиваете, можете ли вы «заключить, что два предиктора влияют на ответ?» Видимо, вы можете, но вы также можете сделать лучше. Для модели с термином взаимодействия вы можете сообщить, какое влияние эти два предиктора фактически оказывают на зависимую переменную (предельные эффекты) таким образом, который не зависит от того, является ли взаимодействие значительным или даже присутствует в модели.

Суть

Если вы удаляете взаимодействие, вы переопределяете модель. Это может быть разумно сделать по многим причинам, некоторым теоретическим и некоторым статистическим, но упрощение интерпретации коэффициентов не входит в их число.

conjugateprior
источник
2
Конечно. И если вы находитесь в R, то вам может показаться, что пакет effectsпроще, чем разбираться в математике, а также для обобщения на более сложные модели.
сопряженное
1
В нижней строке это зависит от того, что вы подразумеваете под «проще».
Джон
Большое спасибо за ссылку Brambor, Clark and Golder (2006)! Это очень разумное объяснение моделей взаимодействия. Очень полезно для понимания того, как интерпретировать (или НЕ) коэффициенты в таких моделях ... Кстати, к статье прилагается интернет-приложение: Модели мультипликативного взаимодействия , которое представляет собой очень удобный обзор дискуссии.
Ландрони
11

Если вы хотите безусловный основной эффект, тогда да, вы действительно хотите запустить новую модель без термина взаимодействия, потому что этот термин взаимодействия не позволяет вам правильно видеть ваши безусловные основные эффекты. Основные эффекты, рассчитанные с учетом присутствия взаимодействия, отличаются от основных эффектов, поскольку обычно их интерпретируют как что-то вроде ANOVA. Например, возможно иметь тривиальное и несущественное взаимодействие, основные эффекты не будут очевидны, когда взаимодействие находится в модели.

Допустим, у вас есть два предиктора, A и B. Когда вы включаете термин взаимодействия, тогда величина A может изменяться в зависимости от B и наоборот. Сообщаемый коэффициент бета в регрессионном выходе для A является тогда лишь одним из многих возможных значений. По умолчанию используется коэффициент A для случая, когда B равен 0, а член взаимодействия равен 0. Но, когда регрессия является просто аддитивной, A не может изменяться в пределах B, и вы просто получаете основной эффект A независимо от Б. Это могут быть очень разные значения, даже если взаимодействие тривиально, потому что они означают разные вещи. Аддитивная модель - единственный способ реально оценить основной эффект сам по себе. С другой стороны, когда ваше взаимодействие имеет смысл (теоретически, не статистически) и вы хотите сохранить его в своей модели, тогда единственный способ оценить A - это рассмотреть его по уровням B. Это именно то, что вы должны учитывать в отношении взаимодействия, а не то, является ли A значимым. Вы действительно можете только увидеть, есть ли безусловный эффект А в аддитивной модели.

Таким образом, модели смотрят на совершенно разные вещи, и это не проблема многократного тестирования. Вы должны смотреть на это с двух сторон. Вы не решаете, основываясь на значении. Лучший основной эффект для отчета от аддитивной модели. Вы принимаете решение о включении или представлении незначительного взаимодействия, основанного на теоретических проблемах или проблемах представления данных и т. Д.

(Это не означает, что здесь нет потенциальных множественных проблем тестирования. Но то, что они означают, во многом зависит от теории, управляющей тестами.)

Джон
источник
Я думаю, что @ rozemarijn больше заботится о «поездках на рыбалку», то есть о запуске большого количества моделей, которые отличаются функцией от того, как получились последние звёзды, а не о множественном тестировании в техническом смысле
сопряженная собственность
1
Вы можете запустить все модели, которые вы хотите. Простое вычисление модели не является тестом. Тест - это логическая процедура, а не математическая. Тот факт, что многие программы по умолчанию возвращают значения p для оценок параметров, как если бы вы провели какой-то тест, не означает, что таковой был.
Джон
И в дополнение к тому, что было сказано выше, можно часто делать тесты, неявно понимая, что они не пройдут или пройдут успешно. Эти тесты учитывают не только вычисление данных, но и их разброс.
Джон
7

Если основные эффекты значительны, но не взаимодействие, вы просто интерпретируете основные эффекты, как вы предложили.

Вам не нужно запускать другую модель без взаимодействия (как правило, это не лучший совет для исключения параметров, основанных на значимости, здесь есть много ответов об этом). Просто примите результаты такими, какие они есть.

Хенрик
источник
1
Вы бы дали тот же совет во втором абзаце, если бы ОП указывал, что взаимодействие не ожидалось теоретически, а было включено в модель в качестве теста на соответствие?
whuber
Спасибо вам всем за эти быстрые реакции. Хотя, похоже, существуют некоторые различия во мнениях ... Джон утверждает, что мне действительно нужно запустить новую модель без эффекта взаимодействия, потому что «основной эффект, рассчитанный с присутствующим взаимодействием, отличается от настоящих основных эффектов».
rozemarijn
Тем не менее, Хенрик утверждает, что я не должен запускать новую модель. Возможно, я смогу принять решение, если буду знать, почему основной эффект, рассчитанный с помощью термина взаимодействия, отличается от истинного основного эффекта ...
rozemarijn
Ожидается, что в ответ на whuber взаимодействие будет происходить теоретически и не будет включено в качестве теста на соответствие.
rozemarijn
1
Чтобы уточнить немного: ключевое различие между идеей эффектов от параметров . Эффекты - это особенности модели в целом, которые могут или не могут быть идентифицированы как конкретные параметры. Когда модель является линейной и нет взаимодействий, они могут это идентифицировать, но когда есть взаимодействия, они не могут. В основном я утверждаю, что если вас заставляют выбирать, как и вы, то вам следует больше заботиться об эффектах, чем о параметрах. И если вы сделаете это, вас больше не волнует, сколько из последних вам нужно, чтобы сгенерировать первое.
сопряженный