У меня случайная перехват логистической регрессии (из-за многократных измерений), и я хотел бы провести некоторую диагностику, особенно в отношении выбросов и влиятельных наблюдений.
Я посмотрел на остатки, чтобы увидеть, есть ли наблюдения, которые выделяются. Но я также хотел бы взглянуть на что-то вроде расстояния Кука или DFFITS. Хосмер и Лемешоу (2000) говорят, что из-за отсутствия модельных диагностических инструментов для коррелированных данных нужно просто приспособить модель регулярной логистической регрессии, игнорируя корреляцию, и использовать инструменты диагностики, доступные для регулярной логистической регрессии. Они утверждают, что это было бы лучше, чем вообще не проводить диагностику.
Книга написана в 2000 году, и мне интересно, есть ли сейчас доступные методы диагностики моделей со смешанной логистической регрессией? Что было бы хорошим подходом для проверки на выбросы?
Изменить (5 ноября 2013 г.):
Из-за отсутствия ответов мне интересно, если диагностика со смешанными моделями вообще не выполняется или, скорее, не важный шаг при моделировании данных. Итак, позвольте мне перефразировать мой вопрос: что вы будете делать, когда нашли «хорошую» регрессионную модель?
Ответы:
Методы диагностики действительно различны для обобщенных линейных смешанных моделей. Разумный, который я видел, основанный на остатках от GLMM, принадлежит Пан и Лин (2005, DOI: 10.1111 / j.1541-0420.2005.00365.x). Они использовали кумулятивные суммы невязок, где порядок определяется либо объясняющими переменными, либо линейным предиктором, тем самым проверяя либо спецификацию функциональной формы данного предиктора, либо функцию связи в целом. Нулевые распределения основаны на имитациях из пространства проектирования из нулевого распределения правильных спецификаций, и они продемонстрировали приличные свойства размера и мощности этого теста. Они конкретно не обсуждали выбросы, но я могу себе представить, что выбросы, вероятно, должны отбрасывать хотя бы функцию связи, слишком сильно изгибая ее в сторону влиятельного наблюдения.
источник
Существует множество различных мнений о том, как лучше всего смотреть на диагностику для смешанных моделей. Как правило, вы захотите взглянуть как на остатки, так и на стандартные аспекты, которые будут рассмотрены для модели с неповторяющимися мерами.
В дополнение к ним, как правило, вы также захотите посмотреть на случайные эффекты сами. Методы часто включают построение графика случайных эффектов различными ковариатами и поиск ненормальности в распределении случайных эффектов. Есть еще много методов (некоторые упоминались в предыдущих комментариях), но обычно это хорошее начало.
источник