При работе со многими входными переменными нас часто беспокоит мультиколлинеарность . Существует ряд мер мультиколлинеарности, которые используются для обнаружения, анализа и / или передачи мультиколлинеарности. Некоторые общие рекомендации:
- Кратный для конкретной переменной
- Допуск, , для конкретной переменной
- Коэффициент инфляции дисперсии, , для конкретной переменной
Номер условия проектирования матрицы в целом:
(Есть несколько других вариантов, обсуждаемых в статье в Википедии, и здесь на SO в контексте R.)
Тот факт, что первые три являются идеальной функцией друг друга, говорит о том, что единственным возможным чистым преимуществом между ними было бы психологическое. С другой стороны, первые три позволяют вам изучать переменные по отдельности, что может быть преимуществом, но я слышал, что метод числа условий считается лучшим.
- Это правда? Лучше всего для чего?
- Является ли число условий идеальной функцией ? (Я думаю, что это будет.)
- Люди находят, что один из них легче всего объяснить? (Я никогда не пытался объяснить эти числа вне класса, я просто даю качественное описание мультиколлинеарности.)
multicollinearity
Gung - Восстановить Монику
источник
источник
Ответы:
Еще в конце 1990-х годов я защитил диссертацию по коллинеарности.
Я пришел к выводу, что показатели состояния были лучшими.
Основная причина заключалась в том, что вместо того, чтобы смотреть на отдельные переменные, он позволяет вам просматривать наборы переменных. Поскольку коллинеарность является функцией наборов переменных, это хорошо.
Кроме того, результаты моего исследования в Монте-Карло показали лучшую чувствительность к проблематичной коллинеарности, но я давно забыл детали.
Подробнее об этом читайте в книгах Дэвида Белсли. Или, если вы действительно хотите, вы можете получить мою диссертацию Диагностика мультиколлинеарности для множественной регрессии: исследование Монте-Карло
источник