Вопросы с тегом «multiple-regression»

12
Есть ли проблема с мультиколлинеарностью и регрессией сплайнов?

При использовании естественных (то есть ограниченных) кубических сплайнов созданные базовые функции являются в высокой степени коллинеарными, и при использовании в регрессии, по-видимому, они дают очень высокую статистику VIF (дисперсионный коэффициент инфляции), сигнализируя о...

12
Ягодная инверсия

У меня есть большие совокупные рыночные данные о продажах вина в США, и я хотел бы оценить спрос на некоторые высококачественные вина. Эти доли рынка были в основном получены из случайной полезной модели вида где включает в себя наблюдаемые характеристики продукта, обозначает цены продукта, -...

12
Интерпретация коэффициентов регрессии LASSO

В настоящее время я работаю над созданием прогнозирующей модели для двоичного результата на наборе данных с ~ 300 переменными и 800 наблюдениями. Я много читал на этом сайте о проблемах, связанных со ступенчатой ​​регрессией, и почему бы не использовать ее. Я изучал регрессию LASSO и ее способность...

12
понимание р-значения в множественной линейной регрессии

Что касается p-значения множественного линейного регрессионного анализа, введение с веб-сайта Minitab приведено ниже. Значение p для каждого члена проверяет нулевую гипотезу о том, что коэффициент равен нулю (без эффекта). Низкое значение p (<0,05) означает, что вы можете отклонить нулевую...

12
Почему бы не использовать надежную регрессию каждый раз?

Примеры этой страницы показывают, что выбросы заметно влияют на простую регрессию, и это можно преодолеть с помощью методов надежной регрессии: http://www.alastairsanderson.com/R/tutorials/robust-regression-in-R/ . Я считаю, что lmrob и ltsReg - это другие надежные методы регрессии. Почему бы не...

12
Должен ли частичный составлять в сумме в множественной регрессии?

Ниже приводится модель, созданная из mtcarsнабора данных: > ols(mpg~wt+am+qsec, mtcars) Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) Model Likelihood Discrimination Ratio Test Indexes Obs 32 LR chi2 60.64 R2 0.850 sigma 2.4588 d.f. 3 R2 adj 0.834 d.f. 28 Pr(>...

12
Исследователь 1 запускает 1000 регрессий, исследователь 2 запускает только 1, оба получают одинаковые результаты - должны ли они делать разные выводы?

Представьте, что исследователь исследует набор данных и запускает 1000 различных регрессий, и он обнаруживает одну интересную связь между ними. Теперь представьте, что другой исследователь с такими же данными запускает всего 1 регрессию, и оказывается, что это тот же самый, что другой исследователь...

11
Должен ли я проводить отдельные регрессии для каждого сообщества или сообщество может быть просто управляющей переменной в агрегированной модели?

Я использую модель OLS с непрерывной переменной индекса ресурса в качестве DV. Мои данные собраны из трех аналогичных сообществ в географической близости друг к другу. Несмотря на это, я подумал, что важно использовать сообщество в качестве управляющей переменной. Как оказалось, сообщество значимо...

11
Проблемы с горячим кодированием и фиктивным кодированием

Мне известен тот факт, что категориальные переменные с k уровнями должны кодироваться с помощью k-1 переменных в фиктивном кодировании (аналогично для многозначных категориальных переменных). Мне было интересно, сколько проблем делает одноразовое кодирование (то есть использование вместо этого k...

11
Зачем использовать возраст в квадрате в качестве ковариации в исследовании генетической ассоциации?

Зачем использовать возраст и квадрат в качестве ковариат в исследовании генетической ассоциации? Я могу понять использование возраста, если он был определен как значимый ковариат, но я не знаю, как использовать возраст в...

11
Значимые предикторы становятся незначимыми при множественной логистической регрессии

Когда я анализирую свои переменные в двух отдельных (одномерных) моделях логистической регрессии, я получаю следующее: Predictor 1: B= 1.049, SE=.352, Exp(B)=2.85, 95% CI=(1.43, 5.69), p=.003 Constant: B=-0.434, SE=.217, Exp(B)=0.65, p=.046 Predictor 2: B= 1.379, SE=.386, Exp(B)=3.97, 95% CI=(1.86,...

11
Регрессия с искаженными данными

Попытка рассчитать количество посещений из демографии и обслуживания. Данные очень искажены. Гистограммы: qq графики (слева - лог): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityи serviceявляются факторными переменными. Я получаю низкое...

11
Как начать строить регрессионную модель, когда наиболее сильно ассоциированный предиктор является двоичным

У меня есть набор данных, содержащий 365 наблюдений трех переменных, а именно pm, tempи rain. Теперь я хочу проверить поведение pmв ответ на изменения в двух других переменных. Мои переменные: pm10 = Ответ (зависимый) temp = предиктор (независимый) rain = предиктор (независимый) Ниже приведена...

11
Диагональные прямые в графике остатков и подгоночных значений для множественной регрессии

Я наблюдаю странные закономерности в остатках для моих данных: [EDIT] Вот графики частичной регрессии для двух переменных: [EDIT2] Добавлен график PP Распределение, кажется, работает хорошо (см. Ниже), но я понятия не имею, откуда может идти эта прямая линия. Любые идеи? [ОБНОВЛЕНИЕ 31.07]...

11
Является ли множественная линейная регрессия в 3 измерениях плоскостью наилучшего соответствия или линией наилучшего соответствия?

Наш проф не входит в математику или даже геометрическое представление множественной линейной регрессии, и это меня немного смущает. С одной стороны, это все еще называется множественной линейной регрессией, даже в более высоких измерениях. С другой стороны, если мы, например , Y = B 0 + B 1 X 1 + Ь...

11
Как исправить один коэффициент и подогнать другие, используя регрессию

Я хотел бы вручную зафиксировать определенный коэффициент, скажем, , затем подогнать коэффициенты ко всем остальным предикторам, сохраняя при этом β 1 = 1,0 в модели.β1=1.0β1=1.0\beta_1=1.0β1=1.0β1=1.0\beta_1=1.0 Как я могу добиться этого с помощью R? Я бы особенно хотел поработать с LASSO (...

11
Могут ли (должны?) Методы регуляризации использоваться в модели случайных эффектов?

Под методами регуляризации я имею в виду лассо, ребристую регрессию, эластичную сеть и тому подобное. Рассмотрим прогностическую модель данных здравоохранения, содержащую демографические и диагностические данные, где прогнозируется продолжительность пребывания в стационаре. Для некоторых людей есть...

11
Как выполнить остаточный анализ для бинарных / дихотомических независимых предикторов в линейной регрессии?

Я выполняю множественную линейную регрессию ниже в R, чтобы предсказать доходность управляемого фонда. reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) Здесь только GRI и MBA являются бинарными / дихотомическими предикторами; остальные предикторы являются непрерывными. Я использую этот...

11
Байесовская модель логита - интуитивное объяснение?

Я должен признаться, что раньше я не слышал об этом термине ни в одном из моих классов, старшекурсников или выпускников. Что значит для логистической регрессии быть байесовским? Я ищу объяснение с переходом от обычной логистики к байесовской логистике, подобное следующему: Это уравнение в модели...

11
Каковы преимущества различных подходов к обнаружению коллинеарности?

Я хочу определить, является ли коллинеарность проблемой в моей регрессии МНК. Я понимаю, что факторы инфляции дисперсии и индекс состояния являются двумя часто используемыми показателями, но мне трудно найти что-то определенное с точки зрения достоинств каждого подхода или какими должны быть...