Вопросы с тегом «regression»

36
Что такое инструментальная переменная?

Инструментальные переменные становятся все более распространенными в прикладной экономике и статистике. Для непосвященных, можем ли мы дать некоторые нетехнические ответы на следующие вопросы: Что такое инструментальная переменная? Когда можно использовать инструментальную переменную? Как найти или...

36
Логистическая регрессия против LDA как классификаторы двух классов

Я пытаюсь обернуть голову вокруг статистической разницы между линейным дискриминантным анализом и логистической регрессией . Правильно ли я понимаю, что для двух классов задачи классификации LDA предсказывает две функции нормальной плотности (по одной для каждого класса), которые создают линейную...

36
Как мне подогнать ограниченную регрессию в R, чтобы коэффициенты всего = 1?

Я вижу похожую ограниченную регрессию здесь: Ограниченная линейная регрессия через указанную точку но мое требование немного отличается. Мне нужно, чтобы коэффициенты сложились в единицу. В частности, я регрессирую доходность 1 ряда валют против 3 других валютных рядов, чтобы инвесторы могли...

36
Как оценить параметр усадки в лассо или гребень регрессии с> 50K переменных?

Я хочу использовать регрессию Лассо или Риджа для модели с более чем 50 000 переменных. Я хочу сделать это, используя программный пакет в R. Как я могу оценить параметр усадки ( )?λλ\lambda Редактирование: Вот точка, до которой я добрался: set.seed (123) Y <- runif (1000) Xv <- sample(c(1,0),...

36
Как интерпретировать коэффициенты из подгонки полиномиальной модели?

Я пытаюсь создать полином второго порядка, соответствующий некоторым имеющимся у меня данным. Допустим, я заговорю это подходит с ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) Я получил: Таким образом, подгонка второго порядка работает...

36
Как вывести дисперсионно-ковариационную матрицу коэффициентов в линейной регрессии

Я читаю книгу о линейной регрессии и у меня возникли проблемы с пониманием дисперсионно-ковариационной матрицы bb\mathbf{b} : Диагональные элементы достаточно просты, но недиагональные немного сложнее, меня удивляет то, что...

36
Как мне узнать, какой метод перекрестной проверки является лучшим?

Я пытаюсь выяснить, какой метод перекрестной проверки лучше всего подходит для моей ситуации. Следующие данные являются лишь примером для проработки проблемы (в R), но мои реальные Xданные ( xmat) связаны друг с другом и в разной степени связаны с yпеременной ( ymat). Я предоставил код R, но мой...

36
Как интерпретировать glmnet?

Я пытаюсь согласовать многомерную модель линейной регрессии с приблизительно 60 предикторами и 30 наблюдениями, поэтому я использую пакет glmnet для регуляризованной регрессии, потому что p> n. Я просматривал документацию и другие вопросы, но все еще не могу интерпретировать результаты, вот...

36
Почему проблемы регрессии называют проблемами «регрессии»?

Мне просто интересно, почему проблемы регрессии называют проблемами «регрессии». Какая история стоит за именем? Одно определение регрессии: «Рецидив в менее совершенное или развитое состояние»....

35
Логистическая регрессия: критерий хи-квадрат anova против значимости коэффициентов (anova () против суммарного () в R)

У меня есть логистическая модель GLM с 8 переменными. Я anova(glm.model,test='Chisq')выполнил тест хи-квадрат в R, и 2 переменные оказываются прогнозирующими, если их упорядочивать в верхней части теста, и не так сильно, когда их упорядочивают в нижней части. Предполагается, summary(glm.model)что...

35
Что такое упругая сеточная регуляризация и как она решает недостатки Риджа (

Всегда ли упругая чистая регуляризация всегда предпочтительнее, чем Lasso & Ridge, поскольку она, похоже, решает недостатки этих методов? Что такое интуиция и какая математика стоит за эластичной...

35
Каковы лучшие практики в определении эффектов взаимодействия?

Кроме буквального тестирования каждой возможной комбинации переменной (ей) в модели ( x1:x2или x1*x2 ... xn-1 * xn). Как вы определяете, если СЛЕДУЕТ или МОЖЕТ существовать взаимодействие между вашими независимыми (мы надеемся) переменными? Каковы лучшие практики в попытке определить...

35
Множественная регрессия или частичный коэффициент корреляции? И отношения между двумя

Я даже не знаю, имеет ли этот вопрос смысл, но в чем разница между множественной регрессией и частичной корреляцией (кроме очевидных различий между корреляцией и регрессией, к которым я не стремлюсь)? Я хочу выяснить следующее: у меня есть две независимые переменные ( , ) и одна зависимая...

35
Назначение функции связи в обобщенной линейной модели

Какова цель функции связи как компонента обобщенной линейной модели? Зачем нам это нужно? Википедия утверждает: Может быть удобно сопоставить область функции связи с диапазоном среднего значения функции распределения В чем преимущество...

35
Повышение градиента для линейной регрессии - почему это не работает?

При изучении Gradient Boosting я не слышал о каких-либо ограничениях в отношении свойств «слабого классификатора», который метод использует для построения и ансамбля модели. Однако я не мог представить себе применение ГБ, которое использует линейную регрессию, и на самом деле, когда я выполнил...

35
Существенное противоречие в линейной регрессии: значимый t-критерий для коэффициента против незначимой общей F-статистики

Я подгоняю модель множественной линейной регрессии между 4 категориальными переменными (по 4 уровня в каждой) и числовым выходом. Мой набор данных имеет 43 наблюдения. Регрессия дает мне следующие из -test для каждого коэффициента наклона: . Таким образом, коэффициент для 4-го предиктора является...

35
Квантильная регрессия: какие стандартные ошибки?

summary.rqФункция от quantreg виньетки предоставляет множество вариантов для стандартных оценок погрешности квантилей коэффициентов регрессии. Каковы специальные сценарии, когда каждый из них становится оптимальным / желательным? «ранг», который дает доверительные интервалы для оцененных параметров...

35
Что такое остаточная стандартная ошибка?

При запуске модели множественной регрессии в R один из выходных сигналов представляет собой остаточную стандартную ошибку 0,0589 при 95 161 степени свободы. Я знаю, что 95 161 степень свободы определяется разницей между количеством наблюдений в моей выборке и количеством переменных в моей модели....

35
Что такое скорректированная формула R-квадрата в lm в R и как ее следует интерпретировать?

Какая точная формула используется в R lm() для Скорректированного R-квадрата? Как я могу интерпретировать это? Скорректированные R-квадрат формулы Кажется, существует несколько формул для расчета скорректированного R-квадрата. Формула...