Вопросы с тегом «multicollinearity»

15
Какова интуиция за сменными образцами при нулевой гипотезе?

Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования...

15
Почему эта регрессия НЕ терпит неудачу из-за совершенной мультиколлинеарности, хотя одна переменная является линейной комбинацией других?

Сегодня я играл с небольшим набором данных и выполнил простую регрессию OLS, которую я ожидал потерпеть неудачу из-за совершенной мультиколлинеарности. Однако это не так. Это подразумевает, что мое понимание мультиколлинеарности неверно. Мой вопрос: где я не прав? Я думаю, что могу показать, что...

14
Почему Ридж Регресс хорошо работает при наличии мультиколлинеарности?

Я узнаю о регрессии гребня и знаю, что регрессия гребня работает лучше при наличии мультиколлинеарности. Мне интересно, почему это правда? Был бы удовлетворен либо интуитивный, либо математический ответ (оба типа ответов были бы еще более удовлетворительными). Кроме того , я знаю, что β всегда...

13
Нужно ли отбрасывать переменные, которые коррелированы / коллинеарны перед запуском kmeans?

Я использую kmeans для определения групп клиентов. У меня есть около 100 переменных для определения кластеров. Каждая из этих переменных представляет собой процент расходов клиента на категорию. Итак, если у меня есть 100 категорий, у меня есть эти 100 переменных, так что сумма этих переменных...

13
Стоит ли беспокоиться о мультиколлинеарности при использовании нелинейных моделей?

Скажем, у нас есть проблема бинарной классификации с в основном категориальными особенностями. Мы используем некоторую нелинейную модель (например, XGBoost или Случайные Леса), чтобы изучить ее. Стоит ли еще беспокоиться о мультиколлинеарности? Почему? Если ответ на вышеприведенный ответ верен, как...

13
Работа с мультиколлинеарностью

Я узнал, что, используя vif()метод carупаковки, мы можем вычислить степень мультиколлинеарности входных данных в модели. Из википедии , если vifзначение больше, чем 5тогда, мы можем считать, что вход страдает от проблемы мультиколлинеарности. Например, я разработал модель линейной регрессии с...

13
Мультиколлинеарность, когда отдельные регрессии значительны, но VIF низкие

У меня есть 6 переменных ( ), которые я использую для предсказания . При выполнении анализа данных я сначала попробовал множественную линейную регрессию. Из этого, только две переменные были значительными. Однако, когда я запустил линейную регрессию, сравнивая каждую переменную в отдельности с ,...

13
Как вы можете обрабатывать нестабильные оценки в линейной регрессии с высокой мультиколлинеарностью, не выбрасывая переменные?

Бета-стабильность в линейной регрессии с высокой мультиколлинеарностью? Скажем, в линейной регрессии переменные и имеют высокую мультиколлинеарность (корреляция составляет около 0,9).х 2Икс1x1x_1Икс2x2x_2 Мы обеспокоены стабильностью коэффициента поэтому мы должны рассмотреть...

13
Линейная регрессия, когда вы знаете только

Пусть Xβ=YXβ=YX\beta =Y . Мы не знаем , YYY точно, только его корреляции с каждым предиктором, XtYXtYX^\mathrm{t}Y . Обычное решение наименьших квадратов (OLS) - это и здесь нет проблем.β=(XtX)−1XtYβ=(XtX)−1XtY\beta=(X^\mathrm{t} X)^{-1} X^\mathrm{t}Y Но предположим, что близок к единственному...

13
Интерпретация пропорций, суммирующих единицу, как независимых переменных в линейной регрессии

Я знаком с понятием категориальных переменных и соответствующим фиктивным кодированием переменных, которое позволяет нам соответствовать одному уровню в качестве базовой линии, чтобы избежать коллинеарности. Я также знаком с тем, как интерпретировать оценки параметров из таких моделей:...

13
Что такое чанк-тесты?

В ответ на вопрос о выборе модели в наличии мультиколлинеарности , Франк Харрелл предложил : Поместите все переменные в модель, но не проверяйте влияние одной переменной, скорректированной с учетом влияния конкурирующих переменных ... Кусочные тесты конкурирующих переменных являются мощными, потому...

12
Что является примером совершенной мультиколлинеарности?

Что является примером идеальной коллинеарности с точки зрения матрицы дизайна ?XXX Я хотел бы привести пример, в котором не может быть оценен, потому что не является обратимым.β^=(X′X)−1X′Yβ^=(X′X)−1X′Y\hat \beta =...

12
Уменьшает ли стандартизация независимых переменных коллинеарность?

Я наткнулся на очень хороший текст о Bayes / MCMC. ИТ-специалисты предполагают, что стандартизация ваших независимых переменных сделает алгоритм MCMC (Metropolis) более эффективным, но также может снизить (мульти) коллинеарность. Это может быть правдой? Это то, что я должен делать как стандарт ....

12
Дисперсионно-ковариационная матричная интерпретация

Предположим, у нас есть линейная модель Model1и vcov(Model1)дает следующую матрицу: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550...

12
Есть ли проблема с мультиколлинеарностью и регрессией сплайнов?

При использовании естественных (то есть ограниченных) кубических сплайнов созданные базовые функции являются в высокой степени коллинеарными, и при использовании в регрессии, по-видимому, они дают очень высокую статистику VIF (дисперсионный коэффициент инфляции), сигнализируя о...

11
Каковы преимущества различных подходов к обнаружению коллинеарности?

Я хочу определить, является ли коллинеарность проблемой в моей регрессии МНК. Я понимаю, что факторы инфляции дисперсии и индекс состояния являются двумя часто используемыми показателями, но мне трудно найти что-то определенное с точки зрения достоинств каждого подхода или какими должны быть...

11
Коллинеарность между категориальными переменными

Есть много о коллинеарности в отношении непрерывных предикторов, но не так много, что я могу найти в категориальных предикторах. У меня есть данные этого типа, показанные ниже. Первый фактор - это генетическая переменная (количество аллелей), второй фактор - категория заболевания. Ясно, что гены...

11
Чувствительна ли машина опорных векторов к корреляции между атрибутами?

Я хотел бы обучить SVM для классификации дел (ИСТИНА / ЛОЖЬ) на основе 20 атрибутов. Я знаю, что некоторые из этих атрибутов тесно взаимосвязаны. Поэтому мой вопрос: чувствителен ли SVM к корреляции или избыточности между функциями? Любая...

11
Что делать с коллинеарными переменными

Отказ от ответственности: это для домашнего проекта. Я пытаюсь найти лучшую модель для цен на алмазы, в зависимости от нескольких переменных, и у меня пока что есть довольно хорошая модель. Однако я столкнулся с двумя переменными, которые явно коллинеарны: >with(diamonds, cor(data.frame(Table,...

11
Ссылка на сумму и разность высококоррелированных переменных, почти не коррелированных

В статье, которую я написал, я моделирую случайные величины и а не и чтобы эффективно устранить проблемы, возникающие, когда и сильно коррелированы и имеют одинаковую дисперсию (как в моем приложении). Судьи хотят, чтобы я дал ссылку. Я мог бы легко доказать это, но, будучи журналом приложений, они...