При выполнении GLM, и вы получаете ошибку «не определено из-за особенностей» в выводе anova, как можно предотвратить возникновение этой ошибки?
Некоторые полагают, что это происходит из-за коллинеарности между ковариатами или что один из уровней отсутствует в наборе данных (см .: интерпретация «не определено из-за особенностей» в lm )
Если бы я хотел , чтобы увидеть , какой «особый режим» вождения модели и у меня есть 4 уровня лечения: Treat 1
, Treat 2
, Treat 3
и Treat 4
, которые записаны в моей таблице как: когда Treat 1
есть 1 остальные равны нулю, когда Treat 2
равен 1 , остальные равны нулю, и т.д., что я должен был бы сделать?
r
generalized-linear-model
regression-coefficients
Platypezid
источник
источник
Ответы:
Вы, вероятно, получаете эту ошибку, потому что две или более ваших независимых переменных совершенно коллинеарны (например, неверное кодирование фиктивных переменных для создания идентичных копий).
Используйте cor () в ваших данных или псевдоним () в вашей модели для более детального изучения.
источник
alias
. Довольно милоОшибка «не определена из-за особенностей» произойдет из-за сильной корреляции между вашими независимыми переменными. Этого можно избежать, если иметь n-1 фиктивных переменных. В вашем случае для переменной обработки вы должны использовать 3 двоичные фиктивные переменные (Treat1, Treat2, Treat3).
В R-программировании функция линейной регрессии lm () приводит к «NA» как коэффи- циенту для высококоррелированных переменных.
источник