Вопросы с тегом «regression»

10
Ясное объяснение «численной устойчивости матричной инверсии» в регрессии гребня и ее роль в уменьшении избыточного соответствия

Я понимаю, что мы можем использовать регуляризацию в задаче регрессии наименьших квадратов как w∗=argminw[(y−Xw)T(y−Xw)+λ∥w∥2]w∗=argminw⁡[(y−Xw)T(y−Xw)+λ‖w‖2]\boldsymbol{w}^* = \operatorname*{argmin}_w \left[ (\mathbf y-\mathbf{Xw})^T(\boldsymbol{y}-\mathbf{Xw}) + \lambda\|\boldsymbol{w}\|^2...

10
Моделирование автокоррелированных двоичных временных рядов

Каков обычный подход к моделированию двоичных временных рядов? Есть ли бумага или учебник, где это лечится? Я думаю о бинарном процессе с сильной автокорреляцией. Что-то вроде знака процесса AR (1), начинающегося с нуля. Скажем, Икс0= 0X0=0X_0 = 0 и Икст + 1= β1ИксT+ ϵT,Xt+1=β1Xt+ϵt, X_{t+1} =...

10
Как выполнить неотрицательную ребристую регрессию?

Как выполнить неотрицательную ребристую регрессию? Доступно неотрицательное лассо scikit-learn, но для риджа я не могу навязать неотрицательность бета-версий, и действительно, я получаю отрицательные коэффициенты. Кто-нибудь знает, почему это? Кроме того, могу ли я реализовать ребро с точки зрения...

10
Какую модель регрессии лучше всего использовать с данными подсчета?

Я пытаюсь немного заняться статистикой, но я застрял в чем-то. Мои данные следующие: Year Number_of_genes 1990 1 1991 1 1993 3 1995 4 Теперь я хочу построить регрессионную модель, чтобы на основе данных можно было прогнозировать количество генов за любой данный год. До сих пор я делал это с помощью...

10
Является ли стандартизированные остатки v / s стандартизированных остатков в модели ЛМ

Являются ли «изученные остатки» и «стандартизированные остатки» одинаковыми в регрессионных моделях? Я построил модель линейной регрессии в R и хотел построить график Studentized Остатки v / s, подобранные значения, но не нашел автоматизированный способ сделать это в R. Предположим, у меня есть...

10
Регресс: почему тест нормальность общих остатков, а остатки обусловливающие

Я понимаю, что в линейной регрессии ошибки предполагаются нормально распределенными при условии прогнозируемого значения y. Затем мы смотрим на остатки как своего рода прокси для ошибок. Это часто рекомендуется для создания вывода , как это: . Однако я не понимаю, в чем смысл получения остатка для...

10
Прогноз данных временных рядов с внешними переменными

В настоящее время я работаю над проектом по прогнозированию данных временных рядов (ежемесячных данных). Я использую R для прогнозирования. У меня есть 1 зависимая переменная (у) и 3 независимых переменных (х1, х2, х3). Переменная y имеет 73 наблюдения, также как и остальные 3 переменные (alos 73)....

10
Периодические сплайны для периодических данных

В комментарии к этому вопросу пользователь @whuber процитировал возможность использования периодической версии сплайнов для подгонки периодических данных. Я хотел бы узнать больше об этом методе, в частности об уравнениях, определяющих сплайны, и о том, как реализовать их на практике (я в основном...

10
Как рассчитать из выборки R в квадрате?

Я знаю, что это, вероятно, обсуждалось где-то еще, но я не смог найти четкого ответа. Я пытаюсь использовать формулу для расчета вне выборки R 2 модели линейной регрессии, где S S R - это сумма квадратов невязок, а S S T - это общая сумма квадратов. Для тренировочного набора ясно,...

10
Сравните статистическую значимость разницы между двумя полиномиальными регрессиями в R

Итак, прежде всего, я провел некоторое исследование на этом форуме, и я знаю, что были заданы чрезвычайно похожие вопросы, но на них обычно не отвечали должным образом, или иногда ответ просто не был достаточно подробным, чтобы я мог понять. Итак, на этот раз мой вопрос: у меня есть два набора...

10
Репликация результатов для линейной регрессии glmnet с использованием универсального оптимизатора

Как говорится в заголовке, я пытаюсь воспроизвести результаты из glmnet linear, используя оптимизатор LBFGS из библиотеки lbfgs. Этот оптимизатор позволяет нам добавлять член регуляризатора L1, не беспокоясь о дифференцируемости, если наша целевая функция (без члена регуляризатора L1) выпуклая....

10
Каково значение двойных столбцов и 2 внизу в обычных наименьших квадратах?

Я видел это обозначение для обычных наименьших квадратов здесь . минвес∥ Xж - у∥22minw‖Xw−y‖22 \min_w \left\| Xw - y \right\|^2_2 Я никогда не видел двойных баров и 2 внизу. Что означают эти символы? У них есть определенная терминология для...

10
Почему вы прогнозируете по модели смешанного эффекта, не включая случайные эффекты для прогноза?

Это скорее концептуальный вопрос, но по мере использования Rя буду ссылаться на пакеты в R. Если цель состоит в том, чтобы подогнать линейную модель для целей прогнозирования, а затем делать прогнозы в тех случаях, когда случайные эффекты могут быть недоступны, есть ли польза от использования...

10
Интуитивно понятное объяснение обратной вероятности веса лечения (IPTWs) в оценке веса склонности?

Я понимаю механизм вычисления весов, используя оценки склонности : а затем применяют веса в регрессионном анализе, и эти веса служат для «контролировать» или разъединять эффекты ковариат в группах лечения и контрольной группы с переменной результата.w i , j = t r e a...

10
Почему я получаю разные прогнозы для ручного полиномиального расширения и использую функцию R `poly`?

Почему я получаю разные прогнозы для ручного полиномиального расширения и использую polyфункцию R ? set.seed(0) x <- rnorm(10) y <- runif(10) plot(x,y,ylim=c(-0.5,1.5)) grid() # xp is a grid variable for ploting xp <- seq(-3,3,by=0.01) x_exp <- data.frame(f1=x,f2=x^2) fit <-...

10
Вопрос интервью с исследователем данных: линейная регрессия с низким и что бы вы сделали

Я столкнулся с вопросом об интервью для работы, на которой интервьюер спросил меня, предположим, что ваш очень низок (от 5 до 10%) для модели ценовой эластичности. Как бы вы решили этот вопрос?R2R2R^2 Я не мог думать ни о чем другом, кроме того факта, что я буду проводить регрессионную диагностику,...

10
Почему мы не можем использовать

Представьте, что у нас есть модель линейной регрессии с зависимой переменной . Мы находим его . Теперь мы делаем другую регрессию, но на этот раз для , и аналогично находим ее . Мне сказали, что я не могу сравнить оба чтобы увидеть, какая модель лучше подходит. Это почему? Причиной для меня было...

10
Почему наклон всегда равен 1 при регрессии ошибок на остатках с использованием OLS?

Я экспериментировал с отношением между ошибками и невязками, используя несколько простых симуляций в R. Одна вещь, которую я обнаружил, заключается в том, что независимо от размера выборки или дисперсии ошибок, я всегда получаю ровно для наклона, когда вы подходите к модели111 е т г о т ы ~ β0+ β1×...

10
Каковы некоторые из наиболее важных «ранних работ» по методам регуляризации?

В нескольких ответах, которые я видел, пользователи CrossValidated предлагают OP найти ранние статьи о Lasso, Ridge и Elastic Net. Для потомков, каковы основополагающие работы в Lasso, Ridge и Elastic Net?...

10
B-Сплайны В. С. Полиномы высокого порядка в регрессии

У меня нет конкретного примера или задачи. Я просто новичок в использовании b-сплайнов, и я хотел лучше понять эту функцию в контексте регрессии. Давайте предположим, что мы хотим оценить взаимосвязь между переменной ответа и некоторыми предикторами . Предикторы включают некоторые числовые...