Что означают взаимодействия сплайн и не сплайн терминов?

10

Если я подгоняю свои данные к чему-то вроде lm(y~a*b), в синтаксисе R, где aэто двоичная переменная и bчисловая переменная, то a:bтермин взаимодействия - это разница между наклоном y~bat a= 0 и at a= 1.

Теперь, скажем, отношения между yи bкриволинейные. Если я сейчас подхожу lm(y~a*poly(b,2)), то a:poly(b,2)1изменение в y~bусловных изменениях на уровне aвыше, и a:poly(b,2)2изменение в y~b^2условных изменениях на уровне a. Это требует некоторого ручного колебания, но если любой из этих коэффициентов взаимодействия значительно отличается от нуля, я могу утверждать, что это означает, что aвлияет не только на вертикальное смещение, yно также на местоположение пика и крутизну сближения с пиком y~b+b^2кривой.

А если я подойдет lm(y~a*bs(b,df=3))? Как интерпретировать a:bs(b,df=3)1, a:bs(b,df=3)2и a:bs(b,df=3)3термины? Являются ли они вертикальными смещениями yсплайна aна каждом из трех сегментов?

f1r3br4nd
источник

Ответы:

7

+1 за хороший и четко сформулированный вопрос. (Если вы хотели немного больше информации о полиномах и сплайнах, вы могли бы найти это полезным, хотя , кажется, есть сильное понимание темы.) Вы также можете прочитать этонедавний вопрос, касающийся интерпретации терминов, определяющих кривизну отношений между ковариатой и переменной ответа. Вы заметите, что я не согласен давать отдельные толкования различным терминам, но лучше всего относиться к ним как к гештальтам. (Однако, чтобы не брать слишком жесткую линию, я признаю, что вы можете вычислить местоположение вершины параболы из бета-версий регрессионной модели, как вы заметили здесь.) В соответствии с моим предыдущим ответом, я думаю, что лучше всего интерпретировать все термины, связанные с одной и той же переменной. Что касается этого конкретного случая, взаимодействие просто устанавливает, что форма кривых отличается между двумя уровнями фактора a.

Gung - Восстановить Монику
источник