У меня есть (смешанная) модель, в которой один из моих предикторов априори должен быть только квадратично связан с предиктором (из-за экспериментальных манипуляций). Следовательно, я хотел бы добавить только квадратичный член в модель. Две вещи не дают мне этого сделать:
- Я думаю, что я читал кое-что, что вы должны всегда включать полином низшего порядка при подборе полиномов высшего порядка. Я забыл, где я его нашел, и в литературе, на которую я смотрел (например, Faraway, 2002; Fox, 2002), я не могу найти хорошего объяснения.
- Когда я добавляю оба, линейный и квадратный член, оба значимы. Когда я добавляю только один из них, они не значимы. Однако линейное отношение предиктора и данных не интерпретируется.
В контексте моего вопроса используется, в частности, смешанная модель lme4
, но я хотел бы получить ответы, которые могли бы объяснить, почему это так или почему нехорошо включать многочлен более высокого порядка, а не многочлен более низкого порядка.
При необходимости я могу предоставить данные.
regression
polynomial
Хенрик
источник
источник
Ответы:
1. Зачем включать линейный термин?
Интересно отметить, что квадратичные отношения могут быть записаны двумя способами:
(где, приравнивая коэффициенты, находим и ). Значение соответствует глобальному экстремуму отношения (геометрически оно определяет вершину параболы).a 2 b 2 + c = a 0 x = b−2a2b=a1 a2b2+c=a0 x=b
Если вы не включите линейный член , возможности уменьшатся доa1x
(где теперь, очевидно, и предполагается, что модель содержит постоянный член ). То есть вы заставляете .c=a0 a0 b=0
В свете этого вопрос № 1 сводится к тому, уверены ли вы, что глобальный экстремум должен возникнуть при . Если да, то вы можете смело опустить линейный член . В противном случае вы должны включить его.x=0 a1x
2. Как понимать изменения в значении, когда термины включены или исключены?
Это подробно обсуждается в соответствующей теме на https://stats.stackexchange.com/a/28493 .
В данном случае значение указывает на наличие кривизны в отношении, а значение указывает на то, что отличен от нуля: похоже, вам нужно включить оба термина (а также, конечно, константу).a2 a1 b
источник
@whuber дал действительно отличный ответ здесь. Я просто хочу добавить небольшой приветственный комментарий. В вопросе говорится, что «линейное отношение предиктора и данных не интерпретируется». Это намекает на общее недоразумение, хотя я обычно слышу его на другом конце («какова интерпретация квадратного [кубического и т. Д.] Термина?»).
Когда у нас есть модель с несколькими различными ковариатами, каждому бета [термину] обычно может быть предоставлена своя интерпретация. Например, если:
тогда мы можем назначить отдельные интерпретации для каждого бета / термина. Например, если средний балл ученика старшей школы был на 1 балл выше - при прочих равных условиях - мы ожидаем, что их средний балл колледжа будет балла выше.β1
Однако важно отметить, что не всегда допустимо толковать модель таким образом. Один очевидный случай - когда есть взаимодействие между некоторыми из переменных, так как было бы невозможно для отдельного члена отличаться и все еще иметь постоянное значение - по необходимости, член взаимодействия также изменился бы. Таким образом, когда есть взаимодействие, мы не интерпретируем основные эффекты, а только простые эффекты , как это хорошо понятно.
Ситуация с властными терминами прямо аналогична, но, к сожалению, не очень понятна. Рассмотрим следующую модель: (В этой ситуации, . Предназначена для представления прототипичный непрерывного ковариативным) Это не возможно для до изменения без изменяющимися также, и наоборот. Проще говоря, когда в модели есть полиномиальные термины, различные термины, основанные на одном и том же лежащем в основе ковариате, не допускаются в отдельных интерпретациях. ( , , и т.д.) термин не имеет никакого самостоятельного значения. Тот факт, что
источник
Ответ @ whuber выше направлен на то, чтобы указать, что опускание линейного члена - это «обычная» квадратичная модель, равносильно тому, чтобы сказать: «Я абсолютно уверен, что экстремум находится в ».x=0
Тем не менее, вам также необходимо проверить, есть ли у используемого вами программного обеспечения "гоча". Некоторые программы могут автоматически центрировать данные при подборе полинома и проверке его коэффициентов, если вы не отключите центрирование полинома. Таким образом, он может соответствовать уравнению, которое выглядит примерно так: где - среднее значение ваших s. Это заставило бы экстремум быть в . ˉ х х х = ˉ хY=b0+b2(x−x¯)2 x¯ x x=x¯
Ваше утверждение о том, что как линейные, так и квадратичные термины являются значимыми при их вводе, требует некоторого пояснения. Например, SAS может сообщить об испытании типа I и / или типа III для этого примера. Тип I тестирует линейное перед добавлением квадратичного. Тип III проверяет линейное с квадратичным в модели.
источник
Brambor, Clark and Golder (2006) (который поставляется с интернет-приложением ) имеют четкое представление о том, как понимать модели взаимодействия и как избежать распространенных ошибок, в том числе о том, почему вы должны (почти) всегда включать термины более низкого порядка ( «учредительные термины») в моделях взаимодействия.
Невыполнение этого требования может привести к заниженной модели, что приведет к искаженным оценкам. Это может привести к ошибочным выводам.
источник