Вопросы с тегом «regression»

10

Ясное объяснение «численной устойчивости матричной инверсии» в регрессии гребня и ее роль в уменьшении избыточного соответствия

Я понимаю, что мы можем использовать регуляризацию в задаче регрессии наименьших квадратов как w∗=argminw[(y−Xw)T(y−Xw)+λ∥w∥2]w∗=argminw⁡[(y−Xw)T(y−Xw)+λ‖w‖2]\boldsymbol{w}^* = \operatorname*{argmin}_w \left[ (\mathbf y-\mathbf{Xw})^T(\boldsymbol{y}-\mathbf{Xw}) + \lambda\|\boldsymbol{w}\|^2...

10

Моделирование автокоррелированных двоичных временных рядов

Каков обычный подход к моделированию двоичных временных рядов? Есть ли бумага или учебник, где это лечится? Я думаю о бинарном процессе с сильной автокорреляцией. Что-то вроде знака процесса AR (1), начинающегося с нуля. Скажем, Икс0= 0X0=0X_0 = 0 и Икст + 1= β1ИксT+ ϵT,Xt+1=β1Xt+ϵt, X_{t+1} =...

regression time-series logistic binary-data autoregressive

10

Как выполнить неотрицательную ребристую регрессию?

Как выполнить неотрицательную ребристую регрессию? Доступно неотрицательное лассо scikit-learn, но для риджа я не могу навязать неотрицательность бета-версий, и действительно, я получаю отрицательные коэффициенты. Кто-нибудь знает, почему это? Кроме того, могу ли я реализовать ребро с точки зрения...

regression lasso regularization ridge-regression

10

Какую модель регрессии лучше всего использовать с данными подсчета?

Я пытаюсь немного заняться статистикой, но я застрял в чем-то. Мои данные следующие: Year Number_of_genes 1990 1 1991 1 1993 3 1995 4 Теперь я хочу построить регрессионную модель, чтобы на основе данных можно было прогнозировать количество генов за любой данный год. До сих пор я делал это с помощью...

regression count-data poisson-regression

10

Является ли стандартизированные остатки v / s стандартизированных остатков в модели ЛМ

Являются ли «изученные остатки» и «стандартизированные остатки» одинаковыми в регрессионных моделях? Я построил модель линейной регрессии в R и хотел построить график Studentized Остатки v / s, подобранные значения, но не нашел автоматизированный способ сделать это в R. Предположим, у меня есть...

r regression residuals terminology

10

Регресс: почему тест нормальность общих остатков, а остатки обусловливающие

Я понимаю, что в линейной регрессии ошибки предполагаются нормально распределенными при условии прогнозируемого значения y. Затем мы смотрим на остатки как своего рода прокси для ошибок. Это часто рекомендуется для создания вывода , как это: . Однако я не понимаю, в чем смысл получения остатка для...

regression assumptions

10

Прогноз данных временных рядов с внешними переменными

В настоящее время я работаю над проектом по прогнозированию данных временных рядов (ежемесячных данных). Я использую R для прогнозирования. У меня есть 1 зависимая переменная (у) и 3 независимых переменных (х1, х2, х3). Переменная y имеет 73 наблюдения, также как и остальные 3 переменные (alos 73)....

time-series multiple-regression forecasting lags

10

Периодические сплайны для периодических данных

В комментарии к этому вопросу пользователь @whuber процитировал возможность использования периодической версии сплайнов для подгонки периодических данных. Я хотел бы узнать больше об этом методе, в частности об уравнениях, определяющих сплайны, и о том, как реализовать их на практике (я в основном...

regression time-series seasonality splines

10

Как рассчитать из выборки R в квадрате?

Я знаю, что это, вероятно, обсуждалось где-то еще, но я не смог найти четкого ответа. Я пытаюсь использовать формулу для расчета вне выборки R 2 модели линейной регрессии, где S S R - это сумма квадратов невязок, а S S T - это общая сумма квадратов. Для тренировочного набора ясно,...

regression machine-learning r-squared out-of-sample

10

Сравните статистическую значимость разницы между двумя полиномиальными регрессиями в R

Итак, прежде всего, я провел некоторое исследование на этом форуме, и я знаю, что были заданы чрезвычайно похожие вопросы, но на них обычно не отвечали должным образом, или иногда ответ просто не был достаточно подробным, чтобы я мог понять. Итак, на этот раз мой вопрос: у меня есть два набора...

r regression statistical-significance regression-coefficients group-differences

10

Репликация результатов для линейной регрессии glmnet с использованием универсального оптимизатора

Как говорится в заголовке, я пытаюсь воспроизвести результаты из glmnet linear, используя оптимизатор LBFGS из библиотеки lbfgs. Этот оптимизатор позволяет нам добавлять член регуляризатора L1, не беспокоясь о дифференцируемости, если наша целевая функция (без члена регуляризатора L1) выпуклая....

r regression regularization glmnet elastic-net

10

Каково значение двойных столбцов и 2 внизу в обычных наименьших квадратах?

Я видел это обозначение для обычных наименьших квадратов здесь . минвес∥ Xж - у∥22minw‖Xw−y‖22 \min_w \left\| Xw - y \right\|^2_2 Я никогда не видел двойных баров и 2 внизу. Что означают эти символы? У них есть определенная терминология для...

regression least-squares linear-model linear-algebra notation

10

Почему вы прогнозируете по модели смешанного эффекта, не включая случайные эффекты для прогноза?

Это скорее концептуальный вопрос, но по мере использования Rя буду ссылаться на пакеты в R. Если цель состоит в том, чтобы подогнать линейную модель для целей прогнозирования, а затем делать прогнозы в тех случаях, когда случайные эффекты могут быть недоступны, есть ли польза от использования...

r multiple-regression mixed-model lme4-nlme

10

Интуитивно понятное объяснение обратной вероятности веса лечения (IPTWs) в оценке веса склонности?

Я понимаю механизм вычисления весов, используя оценки склонности : а затем применяют веса в регрессионном анализе, и эти веса служат для «контролировать» или разъединять эффекты ковариат в группах лечения и контрольной группы с переменной результата.w i , j = t r e a...

intuition weighted-regression propensity-scores

10

Почему я получаю разные прогнозы для ручного полиномиального расширения и использую функцию R `poly`?

Почему я получаю разные прогнозы для ручного полиномиального расширения и использую polyфункцию R ? set.seed(0) x <- rnorm(10) y <- runif(10) plot(x,y,ylim=c(-0.5,1.5)) grid() # xp is a grid variable for ploting xp <- seq(-3,3,by=0.01) x_exp <- data.frame(f1=x,f2=x^2) fit <-...

r regression polynomial

10

Вопрос интервью с исследователем данных: линейная регрессия с низким и что бы вы сделали

Я столкнулся с вопросом об интервью для работы, на которой интервьюер спросил меня, предположим, что ваш очень низок (от 5 до 10%) для модели ценовой эластичности. Как бы вы решили этот вопрос?R2R2R^2 Я не мог думать ни о чем другом, кроме того факта, что я буду проводить регрессионную диагностику,...

regression self-study theory

10

Почему мы не можем использовать

Представьте, что у нас есть модель линейной регрессии с зависимой переменной . Мы находим его . Теперь мы делаем другую регрессию, но на этот раз для , и аналогично находим ее . Мне сказали, что я не могу сравнить оба чтобы увидеть, какая модель лучше подходит. Это почему? Причиной для меня было...

regression data-transformation r-squared

10

Почему наклон всегда равен 1 при регрессии ошибок на остатках с использованием OLS?

Я экспериментировал с отношением между ошибками и невязками, используя несколько простых симуляций в R. Одна вещь, которую я обнаружил, заключается в том, что независимо от размера выборки или дисперсии ошибок, я всегда получаю ровно для наклона, когда вы подходите к модели111 е т г о т ы ~ β0+ β1×...

regression least-squares residuals

10

Каковы некоторые из наиболее важных «ранних работ» по методам регуляризации?

В нескольких ответах, которые я видел, пользователи CrossValidated предлагают OP найти ранние статьи о Lasso, Ridge и Elastic Net. Для потомков, каковы основополагающие работы в Lasso, Ridge и Elastic Net?...

references lasso regularization ridge-regression elastic-net

10

B-Сплайны В. С. Полиномы высокого порядка в регрессии

У меня нет конкретного примера или задачи. Я просто новичок в использовании b-сплайнов, и я хотел лучше понять эту функцию в контексте регрессии. Давайте предположим, что мы хотим оценить взаимосвязь между переменной ответа и некоторыми предикторами . Предикторы включают некоторые числовые...

regression multiple-regression splines polynomial penalized