Вопросы с тегом «regression»

19
Использование круговых предикторов в линейной регрессии

Я пытаюсь подобрать модель, используя данные о ветре (0, 359) и время суток (0, 23), но я обеспокоен тем, что они плохо вписываются в линейную регрессию, поскольку сами по себе они не являются линейными параметрами. Я хотел бы преобразовать их с помощью Python. Я видел некоторые упоминания о...

19
Что сделать вывод из этого лассо-сюжета (glmnet)

Ниже приведен график glmnet с альфа-значением по умолчанию (1, следовательно, лассо) с использованием mtcarsнабора данных в R с использованием mpgв качестве DV и других в качестве переменных-предикторов. glmnet(as.matrix(mtcars[-1]), mtcars[,1]) Что мы можем сделать вывод из этого графика...

19
Избегайте перенастройки в регрессии: альтернативы регуляризации

Регуляризация в регрессии (линейная, логистическая ...) является наиболее популярным способом уменьшения избыточного соответствия. Когда целью является точность прогноза (не объяснение), есть ли хорошие альтернативы регуляризации, особенно подходящие для больших наборов данных (ми / миллиарды...

18
Как я могу оценить стандартные ошибки коэффициента при использовании регрессии гребня?

Я использую гребень регрессии на сильно мультиколлинеарных данных. Используя OLS, я получаю большие стандартные ошибки по коэффициентам из-за мультиколлинеарности. Я знаю, что регрессия гребня является способом решения этой проблемы, но во всех реализациях регрессии гребня, на которые я смотрел,...

18
Могу ли я просто удалить одну из двух переменных-предикторов, которые имеют высокую линейную корреляцию?

Используя коэффициент корреляции Пирсона, у меня есть несколько переменных, которые сильно коррелированы ( и для 2 пар переменных, которые есть в моей модели).ρ = 0,978ρзнак равно0,978\rho = 0.978ρ = 0,989ρзнак равно0,989\rho = 0.989 Причина , некоторые из переменных имеют высокую корреляцию потому...

18
ЛАССО предположения

В сценарии регрессии LASSO, где Y= Xβ+ ϵYзнак равноИксβ+εy= X \beta + \epsilon , и оценки LASSO задаются следующей задачей оптимизации минβ| | Y- Хβ| | +τ| | β| |1минβ||Y-Иксβ||+τ||β||1 \min_\beta ||y - X \beta|| + \tau||\beta||_1 Существуют ли какие-либо предположения относительно распределения...

18
Получение формулы для пределов прогнозирования в линейной модели (т. Е. Интервалы прогнозирования)

Давайте возьмем следующий пример: set.seed(342) x1 <- runif(100) x2 <- runif(100) y <- x1+x2 + 2*x1*x2 + rnorm(100) fit <- lm(y~x1*x2) Это создает модель y на основе x1 и x2, используя регрессию OLS. Если мы хотим предсказать y для данного x_vec, мы можем просто использовать формулу,...

18
Определение функции подбора кривой наилучшего соответствия из линейных, экспоненциальных и логарифмических функций

Контекст: Из вопроса об обмене стеками по математике (могу ли я построить программу) кто-то имеет набор точек и хочет подогнать к нему кривую, линейную, экспоненциальную или логарифмическую. Обычный метод состоит в том, чтобы начать с выбора одного из них (который определяет модель), а затем...

18
Изменение нулевой гипотезы в линейной регрессии

У меня есть некоторые данные, которые сильно коррелируют. Если я запускаю линейную регрессию, я получаю линию регрессии с наклоном, близким к единице (= 0,93). Что я хотел бы сделать, это проверить, значительно ли отличается этот уклон от 1,0. Я ожидаю, что это не так. Другими словами, я хотел бы...

18
Как правильно проверить существенные различия между коэффициентами?

Я надеюсь, что кто-то может помочь исправить ситуацию для меня. Скажем, я хочу проверить, существенно ли отличаются два набора коэффициентов регрессии друг от друга, с помощью следующей настройки: yi=α+βxi+ϵiyi=α+βxi+ϵiy_i = \alpha + \beta x_i + \epsilon_i , с 5 независимыми переменными. 2 группы,...

18
Почему классификатор регрессии гребня работает достаточно хорошо для классификации текста?

Во время эксперимента по классификации текста я обнаружил, что классификатор гребней генерирует результаты, которые постоянно превосходят тесты среди тех классификаторов, которые чаще упоминаются и применяются для задач интеллектуального анализа текста, таких как SVM, NB, kNN и т. Д. Хотя я не...

18
Существует ли графическое представление компромисса смещения в линейной регрессии?

Я страдаю от затемнения. Мне представили следующую картину, чтобы продемонстрировать компромисс смещения дисперсии в контексте линейной регрессии: Я вижу, что ни одна из двух моделей не подходит - «простая» не оценивает сложность отношения XY, а «сложная» просто переобучается, в основном, выучивая...

18
Должны ли доверительные интервалы для коэффициентов линейной регрессии основываться на нормальном или

Давайте иметь некоторую линейную модель, например, просто ANOVA: # data generation set.seed(1.234) Ng <- c(41, 37, 42) data <- rnorm(sum(Ng), mean = rep(c(-1, 0, 1), Ng), sd = 1) fact <- as.factor(rep(LETTERS[1:3], Ng)) m1 = lm(data ~ 0 + fact) summary(m1) Результат таков: Call: lm(formula...

18
Как проверить статистическую значимость категориальной переменной в линейной регрессии?

Если в линейной регрессии у меня есть категориальная переменная ... как я могу узнать статистическую значимость категориальной переменной? Допустим, фактор имеет 10 уровней ... будет 10 различных результирующих t-значений под зонтиком одной факторной переменной ...X1X1X_1X1X1X_1 Мне кажется, что...

18
Как бороться с высокой корреляцией среди предикторов при множественной регрессии?

Я нашел ссылку в статье, которая выглядит так: Согласно Tabachnick & Fidell (1996), независимые переменные с двумерной корреляцией более 0,70 не должны включаться в множественный регрессионный анализ. Проблема: я использовал в дизайне множественной регрессии 3 переменные, коррелированные>...

18
Множественное вложение для исходных переменных

У меня есть набор данных по сельскохозяйственным испытаниям. Моя переменная ответа - это соотношение ответов: log (лечение / контроль). Меня интересует, что опосредует разницу, поэтому я использую мета-регрессии RE (невзвешенные, потому что кажется довольно ясным, что величина эффекта не связана с...

18
Линейная регрессия с ограничением наклона

Я хочу выполнить очень простую линейную регрессию в R. Формула так же проста, как . Однако я бы хотел, чтобы наклон ( ) находился внутри интервала, скажем, между 1,4 и 1,6.Y= а х + бYзнак равноaИкс+бy = ax + baaa Как это может быть...

18
Предполагают ли статистики, что нельзя завалить растение или я просто использую неправильные условия поиска для криволинейной регрессии?

Почти все, что я читал о линейной регрессии и GLM, сводится к следующему: где - не возрастающая или неубывающая функция а - параметр, который вы оценить и проверить гипотезы о. Существуют десятки функций связи и преобразований и чтобы сделать линейной функцией от .f ( x , β ) x β y x y f ( x , β...