Вопросы с тегом «regression»

45
Как смоделировать искусственные данные для логистической регрессии?

Я знаю, что чего-то не хватает в моем понимании логистической регрессии, и буду очень признателен за любую помощь. Насколько я понимаю, логистическая регрессия предполагает, что вероятность результата «1» с учетом входных данных представляет собой линейную комбинацию входных данных, пропущенных...

45
Регрессия, когда остатки OLS обычно не распределяются

На этом сайте есть несколько потоков, обсуждающих, как определить, асимптотически ли нормально распределены остатки OLS . В этом превосходном ответе представлен другой способ оценки нормальности остатков с помощью R-кода . Это еще одно обсуждение практической разницы между стандартизированными и...

45
Насколько хорошо множественная регрессия действительно может «контролировать» ковариаты?

Мы все знакомы с наблюдательными исследованиями, которые пытаются установить причинно-следственную связь между нерандомизированным предиктором X и результатом путем включения каждого мыслимого потенциального препятствия в модель множественной регрессии. Таким образом, «контролируя» всех...

44
Почему мультиколлинеарность не проверяется в современной статистике / машинном обучении

В традиционной статистике при построении модели мы проверяем мультиколлинеарность, используя такие методы, как оценки коэффициента инфляции дисперсии (VIF), но в машинном обучении вместо этого мы используем регуляризацию для выбора признаков и, похоже, не проверяем, коррелированы ли функции вообще....

43
В чем разница?

Разница в различиях уже давно популярна как не экспериментальный инструмент, особенно в экономике. Может ли кто-нибудь дать четкий и нетехнический ответ на следующие вопросы о разнице в различиях. Что такое разностная оценка? Почему оценка разницы в разнице используется? Можем ли мы доверять...

43
Как визуализировать подходящую модель множественной регрессии?

В настоящее время я пишу статью с несколькими множественными регрессионными анализами. Хотя визуализация одномерной линейной регрессии проста с помощью диаграмм рассеяния, мне было интересно, есть ли хороший способ визуализации множественных линейных регрессий? В настоящее время я просто строю...

43
Регрессия за результат (отношение или доля) между 0 и 1

Я думаю о построении модели, предсказывающей отношение , где и и . Таким образом, соотношение будет между и .а / бa/ba/ba > 0 b > 0 0 1a ≤ ba≤ba \le bа > 0a>0a > 0б > 0b>0b > 0000111 Я мог бы использовать линейную регрессию, хотя она, естественно, не ограничивается 0..1. У меня...

43
Почему естественные изменения в журнале являются процентными изменениями? Как насчет журналов, которые делают это так?

Может кто-нибудь объяснить, как свойства журналов делают это таким образом, чтобы вы могли вести линейные регрессии, где коэффициенты интерпретируются как процентные...

43
Случайные лесные предположения

Я новичок в случайном лесу, поэтому я все еще борюсь с некоторыми основными понятиями. В линейной регрессии мы предполагаем независимые наблюдения, постоянную дисперсию ... Какие основные предположения / гипотезы мы делаем, когда используем случайный лес? Каковы основные различия между случайным...

43
Что по существу означают «эндогенность» и «экзогенность»?

Я понимаю, что основное определение эндогенности состоит в том, что не выполняется, но что это означает в смысле реального мира? Я прочитал статью в Википедии с примером спроса и предложения, пытаясь понять это, но это не помогло. Я слышал другое описание эндогенного и экзогенного, как находящегося...

42
Методы регуляризации для логистической регрессии

Регуляризация с использованием таких методов, как Ridge, Lasso, ElasticNet, довольно распространена для линейной регрессии. Я хотел знать следующее: применимы ли эти методы для логистической регрессии? Если да, есть ли различия в том, как их нужно использовать для логистической регрессии? Если эти...

42
Разные способы написания терминов взаимодействия в лм?

У меня есть вопрос о том, какой способ лучше определить взаимодействие в регрессионной модели. Рассмотрим следующие данные: d <- structure(list(r = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), .Label = c("r1","r2"), class = "factor"), s =...

42
Метод максимального правдоподобия и метод наименьших квадратов

В чем основное различие между оценкой максимального правдоподобия (MLE) и оценкой наименьших квадратов (LSE)? Почему мы не можем использовать MLE для прогнозирования значений в линейной регрессии и наоборот?Yyy Любая помощь по этой теме будет принята с...

42
Какое значение имеют коэффициенты логистической регрессии?

В настоящее время я читаю статью, касающуюся места голосования и предпочтений при голосовании на выборах 2000 и 2004 годов. В нем есть диаграмма, которая отображает коэффициенты логистической регрессии. Из курсов лет назад и немного читаяЯ понимаю логистическую регрессию как способ описания...

41
Как центрирование данных избавляет от перехвата в регрессии и PCA?

Я продолжаю читать о случаях, когда мы центрируем данные (например, с помощью регуляризации или PCA), чтобы удалить перехват (как упомянуто в этом вопросе ). Я знаю, что это просто, но мне трудно понять это интуитивно. Может ли кто-нибудь предоставить интуицию или ссылку, которую я могу...

41
Регрессия: Преобразование переменных

При преобразовании переменных, вы должны использовать все те же преобразования? Например, могу ли я выбрать по-разному преобразованные переменные, как в: Пусть - возраст, стаж работы, стаж проживания и доход.Икс1, х2, х3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Или вы должны...

41
Как вывести решение о регрессии гребня?

У меня возникли некоторые проблемы с выводом решения для регрессии гребня. Я знаю регрессионное решение без условия регуляризации: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. Но после добавления термина L2 к функции стоимости, получается решениеλ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2...

41
Чем оценки склонности отличаются от добавления ковариат в регрессии, и когда они предпочтительнее последней?

Я признаю, что я относительно новичок в оценках предрасположенности и причинного анализа. Одна вещь, которая не очевидна для меня как новичка, заключается в том, как «балансировка» с использованием показателей склонности математически отличается от того, что происходит, когда мы добавляем ковариаты...

40
Как представить результаты Лассо, используя glmnet?

Я хотел бы найти предикторы для непрерывной зависимой переменной из набора из 30 независимых переменных. Я использую регрессию Лассо, как это реализовано в пакете glmnet в R. Вот некоторый фиктивный код: # generate a dummy dataset with 30 predictors (10 useful & 20 useless) y=rnorm(100)...