Вопросы с тегом «regression»

14
В чем заключается «механическая» разница между множественной линейной регрессией с лагами и временными рядами?

Я выпускник факультета бизнеса и экономики, который в настоящее время учится на степень магистра в области инженерии данных. Во время изучения линейной регрессии (LR), а затем анализа временных рядов (TS) у меня возник вопрос. Зачем создавать новый метод, т. Е. Временные ряды (ARIMA), вместо...

14
Замена переменных на WoE (вес доказательств) в логистической регрессии

Это вопрос, касающийся практики или метода, которым следуют некоторые из моих коллег. При создании модели логистической регрессии я видел, как люди заменяли категориальные переменные (или непрерывные переменные, которые сгруппированы) на соответствующий вес доказательств (WoE). Предположительно это...

14
Почему остатки в линейной регрессии всегда суммируются до нуля, когда включен перехват?

Я беру курс по моделям регрессии, и одно из свойств, предусмотренных для линейной регрессии, заключается в том, что при включении перехвата остатки всегда суммируются до нуля. Кто-нибудь может дать хорошее объяснение, почему это так?...

14
Как сгладить данные и заставить монотонность

У меня есть некоторые данные, которые я хотел бы сгладить так, чтобы сглаженные точки монотонно уменьшались. Мои данные резко уменьшаются и затем начинают плато. Вот пример использования R df <- data.frame(x=1:10, y=c(100,41,22,10,6,7,2,1,3,1)) ggplot(df, aes(x=x, y=y))+geom_line() Какую хорошую...

14
Почему ? (Одна переменная линейная регрессия)

Примечание. = сумма квадратов, = сумма квадратов ошибок и = регрессионная сумма квадратов. Уравнение в названии часто записывается как:SSTSSTSSTSSESSESSESSRSSRSSR ∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2\sum_{i=1}^n (y_i-\bar y)^2=\sum_{i=1}^n (y_i-\hat...

14
Учитывая две модели линейной регрессии, какая модель будет работать лучше?

Я взял курс машинного обучения в моем колледже. В одной из викторин был задан этот вопрос. Модель 1: y=θx+ϵy=θx+ϵ y = \theta x + \epsilon Модель 2: y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon Какая из вышеперечисленных моделей подойдет для данных лучше? (предположим, что данные могут...

14
Линейная регрессия, что говорит нам статистика F, квадрат R и остаточная стандартная ошибка?

Меня действительно смущает различие в значении относительно контекста линейной регрессии следующих терминов: F статистика R в квадрате Остаточная стандартная ошибка Я нашел эту веб-страницу, которая дала мне отличное понимание различных терминов, связанных с линейной регрессией, однако упомянутые...

14
Разница между моделью пересечения или без нее в логистической регрессии

Мне нравится понимать разницу между моделью пересечения или без нее в логистической регрессии Есть ли какая-то разница между ними, за исключением того, что при пересечении коэффициенты относятся к логарифму (коэффициенту шансов) относительно базовой группы, а без пересечения они относятся к логу...

14
Почему справедливо отклонять временные ряды от регрессии?

Это вообще может быть странный вопрос, но как новичок в предмете, я задаюсь вопросом, почему мы используем регрессию для определения временного ряда, если одним из предположений регрессии является то, что данные должны быть указаны, в то время как данные, к которым применяется регрессия, являются...

14
Почему линейная регрессия имеет допущение об остаточной, а обобщенная линейная модель имеет допущения об отклике?

Почему линейная регрессия и обобщенная модель имеют противоречивые предположения? В линейной регрессии мы предполагаем, что остаток происходит от гауссовой В другой регрессии (логистическая регрессия, регрессия яда) мы предполагаем, что ответ приходит из некоторого распределения (биномиальное,...

14
Что означает, что линейная регрессия является статистически значимой, но имеет очень низкий r квадрат?

Я понимаю, что это означает, что модель плохо предсказывает отдельные точки данных, но установила устойчивую тенденцию (например, у возрастает, когда х

14
Почему в линейной регрессии используется функция стоимости, основанная на вертикальном расстоянии между гипотезой и точкой входных данных?

Допустим, у нас есть входные (предикторные) и выходные (ответные) точки данных A, B, C, D, E, и мы хотим провести линию через точки. Это простая проблема для иллюстрации вопроса, но она может быть распространена и на более высокие измерения. Постановка задачи Текущее наилучшее соответствие или...

14
Зачем использовать ссылку logit в бета-регрессии?

Недавно я был заинтересован в реализации модели бета-регрессии, для получения результата, который является пропорцией. Обратите внимание, что этот результат не будет вписываться в биномиальный контекст, потому что в этом контексте нет осмысленной концепции дискретного «успеха». Фактически,...

14
Как вычислить, имеет ли моя линейная регрессия статистически значимое отличие от известной теоретической линии?

У меня есть некоторые данные, которые соответствуют примерно линейной линии: Когда я делаю линейную регрессию этих значений, я получаю линейное уравнение: Y= 0,997 х - 0,0136Yзнак равно0,997Икс-0,0136y = 0.997x-0.0136 В идеальном мире уравнение должно быть .Y= хYзнак равноИксy = x Ясно, что мои...

14
Линейная регрессия, когда Y ограничен и дискретен

Вопрос прост: уместно ли использовать линейную регрессию, когда Y ограничен и дискретен (например, оценка теста 1 ~ 100, некоторое заранее определенное ранжирование 1 ~ 17)? В этом случае «нехорошо» использовать линейную регрессию или это совершенно...

13
Добавление коэффициентов для получения эффектов взаимодействия - что делать с SE?

У меня есть многомерная регрессия, которая включает в себя взаимодействия. Например, чтобы получить оценку эффекта лечения для самого бедного квинтиля, мне нужно добавить коэффициенты от регрессора лечения к коэффициенту из переменной взаимодействия (которая взаимодействует с лечением и квинтилем...

13
Тестирование нелинейности в логистической регрессии (или других формах регрессии)

Одним из допущений логистической регрессии является линейность в логите. Поэтому, как только я установил и запустил свою модель, я тестировал нелинейность с помощью теста Бокса-Тидвелла. Один из моих постоянных предикторов (X) дал положительный результат на нелинейность. Что я должен делать дальше?...

13
LARS против координатного спуска для лассо

Каковы плюсы и минусы использования LARS [1] по сравнению с использованием координатного спуска для подбора L1-регуляризованной линейной регрессии? Я в основном заинтересован в аспектах производительности (мои проблемы, как правило, Nисчисляются сотнями тысяч и p<20). Однако, любые другие идеи...

13
Поэтапная логистическая регрессия и выборка

Я подгоняю пошаговую логистическую регрессию к набору данных в SPSS. В этой процедуре я подгоняю свою модель к случайному подмножеству, которое составляет ок. 60% от общей выборки, что составляет около 330 случаев. Что мне показалось интересным, так это то, что каждый раз, когда я повторно выбираю...