Я хочу определить, является ли коллинеарность проблемой в моей регрессии МНК. Я понимаю, что факторы инфляции дисперсии и индекс состояния являются двумя часто используемыми показателями, но мне трудно найти что-то определенное с точки зрения достоинств каждого подхода или какими должны быть оценки.
Известный источник, который указывает, какой подход и / или какие оценки являются подходящими, был бы очень полезен.
Аналогичный вопрос был задан на вопросе: «Есть ли причина предпочитать конкретную меру мультиколлинеарности?» но я в идеале после ссылки, которую я могу привести.
Ответы:
Belsley, Кух, и Вельш является текст для ответа на этот вопрос. Они включают в себя подробное обсуждение старой диагностики в разделе «Историческая перспектива». По поводу ВИФ пишут
В конечном итоге BKW рекомендует диагностировать коллинеарность с помощью
источник
Тем не менее, VIFs, как правило, реализованы, не может сказать вам о коллинеарности с перехватом, так как перехват обычно молча включается в эти «вспомогательные» регрессии. Кроме того, если у регрессора высокий VIF, вы не сразу знаете, какие другие регрессоры ответственны за коллинеарность. Вам нужно будет взглянуть на стандартизированные коэффициенты в регрессиях помощников.
Индексы состояния и пропорции декомпозиции коллинеарности Belsley, Kuh & Welsch (Belsley, DA; Kuh, E. & Welsch, RE. Регрессионная диагностика: выявление влиятельных данных и источников коллинеарности. John Wiley & Sons, 1980) гораздо сложнее понять. Я работал с ними несколько лет назад, но я не буду пытаться объяснить их здесь, не получив переподготовки ;-)
Эта диагностика действительно позволяют обнаруживать коллинеарности с перехватом. И вы можете исследовать пропорции разложения коллинеарности, чтобы определить, какие другие регрессоры ответственны за коллинеарность одного данного регрессора.
источник
Что касается широко доступных ссылок на цитирование, в книге «Далекий» на стр. 117 приведено практическое правило свыше 30 для выявления проблем на основе номеров условий, а в «Введении в статистическое обучение» , стр. 101, говорится, что значения VIF выше 5 или 10 указывают на проблему. ,
Вероятно, более важным, чем то, какой метод вы используете для определения мультиколлинеарности, будет то, как вы справитесь с этим.
источник