Модерируемая регрессия: почему мы вычисляем термин * product * между предикторами?

12

Модерируемый регрессионный анализ часто используется в социальных науках для оценки взаимодействия между двумя или более предикторами / ковариатами.

Как правило, с двумя переменными предикторами применяется следующая модель:

Y=β0+β1X+β2M+β3XM+e

Обратите внимание, что проверка модерации выполняется термином продукта XM (умножение между независимой переменной X и переменной модератора M ). Мой очень фундаментальный вопрос: почему мы на самом деле вычисляем термин продукта между X и M ? Почему нет, например, абсолютной разницы |MX|или просто сумма X+M ?

Интересно, что Кенни ссылается на эту проблему здесь http://davidakenny.net/cm/moderation.htm , говоря: «Как будет видно, проверка на модерацию не всегда выполняется термином XM продукта», но дальнейшее объяснение не приводится. , Формальная иллюстрация или доказательство было бы поучительным, я думаю / надеюсь.

знаменатель
источник

Ответы:

12

«Модератор» влияет на коэффициенты регрессии Y против X : они могут изменяться при изменении значений модератора. Таким образом, в полной общности простая регрессионная модель модерации

E(Y)=α(M)+β(M)X

где и являются функции замедлителя , а не постоянные , не затронутые значения .βαβMMM

В том же духе, в котором регрессия основана на линейном приближении отношений между и , мы можем надеяться, что и и являются, по крайней мере, приблизительно, линейными функциями во всем диапазоне значений в данных:Y αXYαM MβMM

E(Y)=α0+α1M+O(M2)+(β0+β1M+O(M2))X=α0+β0X+α1M+β1MX+O(M2)+O(M2)X.

Отбрасывание нелинейных ("больших-O") слагаемых в надежде, что они слишком малы для материи, дает модель мультипликативного (билинейного) взаимодействия

(1)E(Y)=α0+β0X+α1M+β1MX.

Этот вывод предполагает интересную интерпретацию коэффициентов: является скорость , при которой изменяет перехват в то время как является скорость , при которой меняет наклон . ( и - это наклон и , когда (формально) установлен на ноль.) - это коэффициент «слагаемого продукта» . Это отвечает на вопрос таким образом: M β 1 M α 0 β 0 Mα1Mβ1Mα0β0M M Xβ1MX

Мы моделируем модерацию с термином продукта , когда мы ожидаем , что модератор будет (примерно в среднем) имеет линейную зависимость с наклоном против .МMXMXY X


Интересно, что этот вывод указывает путь к естественному расширению модели, которая может предложить способы проверки правильности соответствия. Если вас не волнует нелинейность в вы либо знаете, либо предполагаете, что модель точна, - тогда вы захотите расширить модель, чтобы она соответствовала пропущенным терминам:( 1 )X(1)

E(Y)=α0+β0X+α1M+β1MX+α2M2+β2M2X.

Проверка гипотезы оценивает соответствия. Оценка и может указывать, каким образом может потребоваться расширение модели : включить нелинейность в (когда ) или более сложные модерирующие отношения (когда ) или, возможно, и то и другое. (Обратите внимание, что этот тест не будет предложен расширением степенной серии обобщенной функции .)α 2 β 2 ( 1 ) М α 20 β 20α2=β2=0α2β2(1)Mα20β20f(X,M)


Наконец, если вы обнаружите, что коэффициент взаимодействия существенно не отличается от нуля, но что подгонка является нелинейной (о чем свидетельствует значительное значение ), то вы пришли бы к выводу, что (a) существует умеренность, но ( б) он не моделируется термином , а вместо этого - членами более высокого порядка, начинающимися с . Возможно, это тот феномен, о котором говорил Кенни.β 2 M X M 2 Xβ1β2MXM2X

Whuber
источник
8

Если вы используете сумму предикторов для моделирования их взаимодействия, ваше уравнение будет:

Y=β0+β1X+β2M+β3(X+M)+e=β0+β1X+β2M+β3X+β3M+e=β0+(β1+β3)X+(β2+β3)M+e=β0+β1X+β2M+e

где и . Следовательно, ваша модель не будет взаимодействовать вообще. Очевидно, что это не так с продуктом.β 2 = ββ1=β1+β3β2=β2+β3

Напомним определение абсолютного значения:

|XM|={XM,XMMX,X<M

Хотя вы можете уменьшить модель к тому, который содержит только термины и , используя def. изабсолютное значение является «специализированной формой модерации, которая вряд ли будет реалистичной во многих ситуациях», как указано в комментарии ниже.х м | X - M |β0+β1X+β2M+β3|XM|+eXM|XM|

Милош
источник
1
На самом деле, в том числетермин явно является формой умеренности: значение изменяется . Однако это ограниченная специализированная форма умеренности, которая вряд ли будет реалистичной во многих ситуациях. Неправильно говорить, что такая модель имеет «только основные эффекты». |XM|Mβ2
whuber
1
Да, вы правы,это форма модерации, я увлекся трансформацией и соответственно отредактирую ответ. Спасибо за указание на это. |XM|
Милос
@Milos: Ваш пример с суммой предикторов был откровением, несколько смущающим, я должен сказать, потому что я должен был уже понять математические последствия;) whuber: Насколько я понимаю, абсолютное значение полезно только когда обе переменные предиктора измеряются в одних и тех же единицах (например, два психометрических теста, использующих одну и ту же метрику, например, z-оценки или T-оценки). Абсолютная разница между X и M является полезной метрикой, хотя и не единственно возможной (т. Е. Также может использоваться термин prodcut).
знаменатель
6

Вы не найдете формального доказательства использования мультипликативного модератора. Вы можете поддержать этот подход другими способами. Например, посмотрите на разложение Тейлора-Маклаурина функции :f(X,M)

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

Если вы подключите функцию этой формы в уравнение Тейлора, вы получите это:f(X,M)=β0+βXX+βMM+βXMXM

f(X,M)=β0+βXX+βMM+βXMXM

Итак, обоснование здесь заключается в том, что эта конкретная мультипликативная форма модерации является в основном приближением Тейлора второго порядка общего отношения модерацииf(X,M)

ОБНОВЛЕНИЕ: если вы включите квадратичные термины, как предложил @whuber, то это произойдет: подключите это к Тейлору:

g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

Это показывает, что наша новая модель с квадратичными членами соответствует полному приближению Тейлора второго порядка, в отличие от исходной модели модерации .f ( X , M )g(X,M)f(X,M)

Аксакал
источник
Поскольку основой вашего аргумента является разложение Тейлора, почему вы не включили два других квадратичных члена и ? Правда, они не являются формами модерации, но их включение в модель обычно влияет на . M 2 β X MX2M2βXM
whuber
@whuber, я решил оставить пост коротким - вот основная причина. В противном случае я начал писать о своем предпочтении включать термины второго порядка, когда у вас есть перекрестный термин, а затем исключать его.
Аксакал