Тестирование нелинейности в логистической регрессии (или других формах регрессии)

13

Одним из допущений логистической регрессии является линейность в логите. Поэтому, как только я установил и запустил свою модель, я тестировал нелинейность с помощью теста Бокса-Тидвелла. Один из моих постоянных предикторов (X) дал положительный результат на нелинейность. Что я должен делать дальше?

Поскольку это нарушение допущений, я должен избавиться от предиктора (X) или включить нелинейное преобразование (X * X). Или преобразовать переменную в категориальную? Если у вас есть ссылка, не могли бы вы указать мне на это тоже?

tosonb1
источник

Ответы:

8

rcsИкс

Вы можете сравнить результаты с тестом Box-Tidwell, используя пакет boxTidwell()из автомобиля .

Преобразование непрерывных предикторов в категориальные, как правило, не очень хорошая идея, см., Например, Проблемы, вызванные категоризацией непрерывных переменных .

хл
источник
5

Это может быть целесообразным включить нелинейное преобразование х , но , вероятно , не просто х х х , т.е. х 2 . Я полагаю, что вы можете найти эту полезную ссылку при определении того, какое преобразование использовать:

GEP Box и Пол У. Тидуэлл (1962). Преобразование независимых переменных. Технометрия Том 4 № 4, стр. 531-550. http://www.jstor.org/stable/1266288

Некоторые считают, что семейство преобразований Бокса-Тидвелла является более общим, чем это часто подходит для интерпретируемости и скупости. Патрик Ройстон и Дуг Альтман в одной из влиятельных статей 1994 года представили термин дробные полиномы для преобразований Бокса-Тидвелла с простыми рациональными степенями:

П. Ройстон и Д. Г. Альтман (1994). Регрессия с использованием дробных полиномов непрерывных ковариат: экономное параметрическое моделирование. Прикладная статистика Том 43: стр. 429–467. http://www.jstor.org/stable/2986270

Патрик Ройстон, в частности, продолжал работать и публиковать как статьи, так и программное обеспечение по этому вопросу, кульминацией которого стала книга с Вилли Сауэрбрей:

P. Royston и W. Sauerbrei (2008). Создание модели с множественными переменными: прагматический подход к регрессионному анализу на основе дробных полиномов для моделирования непрерывных переменных . Чичестер, Великобритания: Wiley. ISBN 978-0-470-02842-1

универсальный
источник
4

Не забудьте проверить взаимодействие между X и другими независимыми переменными. Оставляя немоделированные взаимодействия, можно заставить X выглядеть так, как будто он имеет нелинейный эффект, когда он просто имеет неаддитивный эффект.

conjugateprior
источник
Хорошая точка зрения. Я только сталкивался с обратным: предположить, что эффект является линейным, когда он не может привести к ложным статистическим данным для мультипликативных терминов взаимодействия.
OneStop
1
@onetop, у тебя есть упоминание об этом? Я верю в это, но мне трудно понять, почему именно это произойдет.
Макрос