В ответ на вопрос о выборе модели в наличии мультиколлинеарности , Франк Харрелл предложил :
Поместите все переменные в модель, но не проверяйте влияние одной переменной, скорректированной с учетом влияния конкурирующих переменных ... Кусочные тесты конкурирующих переменных являются мощными, потому что коллинеарные переменные объединяют силы в общем тесте ассоциации множественной степени свободы вместо конкурировать друг с другом, как при тестировании переменных по отдельности.
Что такое чанк-тесты ? Можете ли вы привести пример их применения в r
?
Ответы:
@ mark999 предоставил отличный ответ. В дополнение к совместному тестированию полиномиальных терминов, вы можете совместно протестировать («chunk test») любой набор переменных. Предположим, у вас была модель с конкурирующими коллинеарными переменными: окружность трицепса, талия, окружность бедра, все измерения размера тела. Чтобы получить общий тест на размер тела, вы можете сделать
NA
tricep, waist, hip
источник
Комментарий Макроса правильный, как и Энди. Вот пример.
Вместо того , чтобы рассматривать
x2
иx2^2
термины по отдельности, «тест кусок» является тест 2-ДФ , который проверяет нулевую гипотезу о том , что коэффициенты этих терминов равны нулю (я считаю , что это чаще называют что - то вроде «общего линейного F-тест» ). Значение p для этого теста равно 0,0037, заданному какanova(ols1)
.Обратите внимание , что в
rms
пакете, вы должны определитьx2
условия , какpol(x2, 2)
для ,anova.rms()
чтобы знать , что они должны быть проверены вместе.anova.rms()
проведет аналогичные тесты для переменных-предикторов, которые представлены как ограниченные кубические сплайны с использованием, напримерrcs(x2, 3)
, и для категориальных переменных-предикторов. Это также будет включать в себя термины взаимодействия в «кусках».Если вы хотите выполнить тестовый блок для общих «конкурирующих» переменных предиктора, как упомянуто в цитате, я считаю, что вам придется делать это вручную, подбирая две модели по отдельности, а затем используя
anova(model1, model2)
. [Редактировать: это неверно - см. Ответ Фрэнка Харрелла.]источник