Как мне моделировать взаимодействия между объясняющими переменными, если одна из них может иметь квадратные и кубические члены?

10

Я искренне надеюсь, что я сформулировал этот вопрос таким образом, чтобы на него можно было дать окончательный ответ - если нет, пожалуйста, дайте мне знать, и я попробую еще раз! Я должен также предположить, что я буду использовать R для этих анализов.

У меня есть несколько мер, plant performance (Ys)которые, я подозреваю, были под влиянием четырех методов лечения flower thinning (X1), fertilization (X2), leaf clipping (X3), и я biased flower thinning (X4). При всех возможных значениях Y, N составляет не менее 242, поэтому размеры моей выборки были большими. Все участки были либо прорежены, либо нет, но каждый участок также подвергался одному (и только одному) из трех других обработок (или нет - были также контрольные участки). Идея этого проекта состояла в том, чтобы проверить, способны ли другие три процедуры «маскировать» или «усиливать» эффекты истончения. Таким образом, по замыслу последние три обработки (X2-X4) не могли взаимодействовать друг с другом, потому что они не были пересечены, но каждая из них может взаимодействовать с истончением цветов - и они, вероятно, делают.

Мои явные гипотезы состоят в том, что 1) прореживание цветения будет значительным, и что 2) условия взаимодействия X1*X2, X1*X3, and X1*X4,между прореживанием цветов и другими тремя обработками также будут значительными. То есть истончение цветов должно иметь значение, но способы, которыми оно имеет значение, должны быть существенно изменены в зависимости от того, что сделали остальные три процедуры.

Я хотел бы включить всю эту информацию в смешанную модель:

Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)

Но есть одна проблема: у меня есть веские основания полагать, что эффекты истончения на Y нелинейны. Они, вероятно, квадратичны, но в некоторых случаях могут быть даже кубическими. Это связано с тем, что влияние истончения на производительность, скорее всего, будет возрастать быстрее при более высоких уровнях прореживания. Если я попытаюсь смоделировать это нелинейное отношение с помощью приведенного выше уравнения, добавив квадратичные и кубические слагаемые для X1, то я не уверен, как моделировать слагаемые взаимодействия - должен ли я включать все возможные комбинации X1, (X1) ^ 2 и (X1) ^ 3 * X2, X3 и X4? Потому что это кажется большим количеством параметров, чтобы попытаться оценить, даже с учетом количества точек данных, которые у меня есть, и я не уверен, как интерпретировать полученные результаты. Тем не менее, у меня нет биологической причины думать, что это было бы неблагоразумным способом смоделировать ситуацию.

Итак, у меня есть три мысли о том, как решить эту проблему:

  1. Сначала установите модель меньшего размера, например Y ~ X1 + X1^2 + X^3 + Random effects, с единственной целью выяснить, является ли взаимосвязь между прореживанием и Y линейной, квадратичной или кубической, а затем преобразовать прореживание через квадратный или кубический корень, чтобы соответствующим образом линеаризовать взаимосвязь. Оттуда члены взаимодействия могут быть смоделированы, как указано выше, с преобразованной переменной.
  2. Предположим, что существенные взаимодействия, если они происходят, влияют только на один из членов X1 (т.е. только на линейный, квадратичный или кубический член), и моделируйте взаимодействия соответствующим образом. Я даже не уверен, имеет ли этот подход смысл.
  3. Просто установите «полную модель» с каждым возможным термином взаимодействия между условиями прореживания и другими обработками, как обсуждалось выше. Затем удалите незначительные термины взаимодействия и используйте графики и другие методы для интерпретации результатов.

Какой из этих подходов, если таковой имеется, имеет смысл и почему, учитывая, что я заинтересован в проверке гипотез, а не в выборе модели? В частности, если № 1 выше не имеет смысла, почему? Я прочитал эту статью и эту статью и попытался переварить то, что они могут значить для меня, но любые источники для дальнейшего чтения также будут высоко оценены!

Bajcz
источник

Ответы:

7

Ни один из этих подходов не будет работать должным образом. Подход 3. подошел близко, но потом вы сказали, что откажетесь от незначительных сроков. Это проблематично, потому что из-за коллинеарностей невозможно найти, какие термины удалить, и потому что это даст вам неправильные степени свободы при проверке гипотез, если вы хотите сохранить ошибку типа I.

В зависимости от эффективного размера выборки и соотношения сигнал / шум в вашей задаче, я бы предложил подобрать модель со всеми терминами продукта и основного эффекта и интерпретировать модель, используя графики и «тесты фрагментов» (множественные df тесты связанных терминов, т.е. тест на общее взаимодействие, тест на нелинейное взаимодействие, тест на общий эффект, включая основной эффект + взаимодействие и т. д.). Пакет R rmsпозволяет легко это сделать для стандартных одномерных моделей и для продольных моделей, когда многомерно нормален. Пример:Y

# Fit a model with splines in x1 and x2 and tensor spline interaction surface
# for the two.  Model is additive and linear in x3.
# Note that splines typically fit better than ordinary polynomials
f <- ols(y ~ rcs(x1, 4) * rcs(x2, 4) + x3)
anova(f)   # get all meaningful hypothesis tests that can be inferred
           # from the model formula
bplot(Predict(f, x1, x2))    # show joint effects
plot(Predict(f, x1, x2=3))   # vary x1 and hold x2 constant

Когда вы увидите anovaтаблицу, вы увидите строки с метками, All Interactionsкоторые для всей модели тестируют совокупное влияние всех терминов взаимодействия. Для отдельного предиктора это полезно, только когда предиктор взаимодействует с более чем одной переменной. В printметоде есть опция, anova.rmsпоказывающая каждой строкой таблицы, какие именно параметры проверяются относительно нуля. Все это работает со смесью категориальных и непрерывных предикторов.

Если вы хотите использовать обычные полиномы, используйте polвместо rcs.

К сожалению, я не реализовал смешанные модели эффектов.

Фрэнк Харрелл
источник
1
Спасибо за этот ответ. Я никогда раньше не использовал сплайны, но, думаю, я понимаю ваш пример. У меня есть несколько дополнительных вопросов, если это нормально? 1. Когда вы смотрите на анову из ols, как в вашем примере, что подразумевается под «Все взаимодействия» под фактором? То есть все взаимодействия с чем? 2. Будет ли подобный подход допустимым в смешанном моделировании? Я думаю, что застрял с необходимостью случайных факторов. Ваш пример совместим, например, с lme4? 3. Будет ли это работать, если некоторые из взаимодействующих методов являются категоричными? Например, что если X2 был двухуровневым фактором?
Байч
2

Я фанат использования непараметрических сглаживающих регрессий для оценки функциональных форм отношений между зависимыми переменными и предикторами, даже когда впоследствии я собираюсь оценить модели параметрической регрессии. Хотя я очень часто находил нелинейные отношения, я никогда не находил термин взаимодействия нелинейного взаимодействия, даже когда основные эффекты сильно нелинейны. Мой вывод: эффекты взаимодействия не обязательно должны состоять из тех же функциональных форм, что и предикторы, из которых они состоят.

Alexis
источник
Итак, чтобы уточнить, вы должны понять, что если я выберу вариант № 2, я могу просто включить термины взаимодействия с линейным термином X1 и не беспокоиться о «терминах взаимодействия более высокого порядка», например, X1 ^ 2 * X3 и т. Д.?
Байч
1
@Bajcz Ну ... я думаю, что говорю две вещи: (1) мне удалось обойтись в наборах данных, с которыми я столкнулся при линейных взаимодействиях, но также (2) мне нравится смотреть (используя непараметрические регрессии) и позвольте данным сказать мне, должен ли я рассмотреть нелинейные альтернативы. [Использование подхода проверки модели или гипотезы к нелинейным терминам является ИМО неправильным способом решения этой проблемы, поскольку это предполагает, например, вывод, основанный, например, на произвольном наборе полиномиальных терминов, а не на самих данных.]
Алексис
3
Нет серьезных оснований полагать, что взаимодействия, скорее всего, будут линейными. Я сталкивался с отличными примерами нелинейных взаимодействий. Идея «смотреть» и «сообщать вам данные» сопровождается проблемами вывода, в том числе проблемами покрытия с плохим доверительным интервалом.
Фрэнк Харрелл
1
@FrankHarrell Спасибо! Ваше первое предложение - именно то, что я пытался донести до моего (2) в комментарии выше (мой прошлый опыт может сильно измениться в будущем). OTOH: не позволяя данным говорить - это отличная стратегия для вменения выводов об артефактах предположений моделирования в выводы о фактических данных.
Алексис