Вопросы с тегом «regression»

45

Как смоделировать искусственные данные для логистической регрессии?

Я знаю, что чего-то не хватает в моем понимании логистической регрессии, и буду очень признателен за любую помощь. Насколько я понимаю, логистическая регрессия предполагает, что вероятность результата «1» с учетом входных данных представляет собой линейную комбинацию входных данных, пропущенных...

45

Регрессия, когда остатки OLS обычно не распределяются

На этом сайте есть несколько потоков, обсуждающих, как определить, асимптотически ли нормально распределены остатки OLS . В этом превосходном ответе представлен другой способ оценки нормальности остатков с помощью R-кода . Это еще одно обсуждение практической разницы между стандартизированными и...

regression least-squares residuals assumptions normality-assumption

45

Насколько хорошо множественная регрессия действительно может «контролировать» ковариаты?

Мы все знакомы с наблюдательными исследованиями, которые пытаются установить причинно-следственную связь между нерандомизированным предиктором X и результатом путем включения каждого мыслимого потенциального препятствия в модель множественной регрессии. Таким образом, «контролируя» всех...

multiple-regression ancova observational-study

44

Почему мультиколлинеарность не проверяется в современной статистике / машинном обучении

В традиционной статистике при построении модели мы проверяем мультиколлинеарность, используя такие методы, как оценки коэффициента инфляции дисперсии (VIF), но в машинном обучении вместо этого мы используем регуляризацию для выбора признаков и, похоже, не проверяем, коррелированы ли функции вообще....

regression machine-learning multicollinearity regularization vif

43

В чем разница?

Разница в различиях уже давно популярна как не экспериментальный инструмент, особенно в экономике. Может ли кто-нибудь дать четкий и нетехнический ответ на следующие вопросы о разнице в различиях. Что такое разностная оценка? Почему оценка разницы в разнице используется? Можем ли мы доверять...

regression econometrics difference-in-difference

43

Как визуализировать подходящую модель множественной регрессии?

В настоящее время я пишу статью с несколькими множественными регрессионными анализами. Хотя визуализация одномерной линейной регрессии проста с помощью диаграмм рассеяния, мне было интересно, есть ли хороший способ визуализации множественных линейных регрессий? В настоящее время я просто строю...

regression data-visualization multiple-regression

43

Регрессия за результат (отношение или доля) между 0 и 1

Я думаю о построении модели, предсказывающей отношение , где и и . Таким образом, соотношение будет между и .а / бa/ba/ba > 0 b > 0 0 1a ≤ ba≤ba \le bа > 0a>0a > 0б > 0b>0b > 0000111 Я мог бы использовать линейную регрессию, хотя она, естественно, не ограничивается 0..1. У меня...

regression logistic generalized-linear-model beta-distribution beta-regression

43

Почему естественные изменения в журнале являются процентными изменениями? Как насчет журналов, которые делают это так?

Может кто-нибудь объяснить, как свойства журналов делают это таким образом, чтобы вы могли вести линейные регрессии, где коэффициенты интерпретируются как процентные...

regression logarithm mathematical-statistics

43

Случайные лесные предположения

Я новичок в случайном лесу, поэтому я все еще борюсь с некоторыми основными понятиями. В линейной регрессии мы предполагаем независимые наблюдения, постоянную дисперсию ... Какие основные предположения / гипотезы мы делаем, когда используем случайный лес? Каковы основные различия между случайным...

regression classification random-forest

43

Что по существу означают «эндогенность» и «экзогенность»?

Я понимаю, что основное определение эндогенности состоит в том, что не выполняется, но что это означает в смысле реального мира? Я прочитал статью в Википедии с примером спроса и предложения, пытаясь понять это, но это не помогло. Я слышал другое описание эндогенного и экзогенного, как находящегося...

regression causality instrumental-variables

42

Какой алгоритм используется в линейной регрессии?

Я обычно слышу о "обычных наименьших квадратах". Это наиболее широко используемый алгоритм, используемый для линейной регрессии? Есть ли причины использовать...

regression least-squares algorithms computational-statistics numerics

42

Методы регуляризации для логистической регрессии

Регуляризация с использованием таких методов, как Ridge, Lasso, ElasticNet, довольно распространена для линейной регрессии. Я хотел знать следующее: применимы ли эти методы для логистической регрессии? Если да, есть ли различия в том, как их нужно использовать для логистической регрессии? Если эти...

regression logistic regularization

42

Разные способы написания терминов взаимодействия в лм?

У меня есть вопрос о том, какой способ лучше определить взаимодействие в регрессионной модели. Рассмотрим следующие данные: d <- structure(list(r = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), .Label = c("r1","r2"), class = "factor"), s =...

r regression interaction

42

Метод максимального правдоподобия и метод наименьших квадратов

В чем основное различие между оценкой максимального правдоподобия (MLE) и оценкой наименьших квадратов (LSE)? Почему мы не можем использовать MLE для прогнозирования значений в линейной регрессии и наоборот?Yyy Любая помощь по этой теме будет принята с...

regression estimation maximum-likelihood least-squares

42

Какое значение имеют коэффициенты логистической регрессии?

В настоящее время я читаю статью, касающуюся места голосования и предпочтений при голосовании на выборах 2000 и 2004 годов. В нем есть диаграмма, которая отображает коэффициенты логистической регрессии. Из курсов лет назад и немного читаяЯ понимаю логистическую регрессию как способ описания...

regression logistic interpretation

41

Как центрирование данных избавляет от перехвата в регрессии и PCA?

Я продолжаю читать о случаях, когда мы центрируем данные (например, с помощью регуляризации или PCA), чтобы удалить перехват (как упомянуто в этом вопросе ). Я знаю, что это просто, но мне трудно понять это интуитивно. Может ли кто-нибудь предоставить интуицию или ссылку, которую я могу...

regression pca centering

41

Регрессия: Преобразование переменных

При преобразовании переменных, вы должны использовать все те же преобразования? Например, могу ли я выбрать по-разному преобразованные переменные, как в: Пусть - возраст, стаж работы, стаж проживания и доход.Икс1, х2, х3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Или вы должны...

r regression logistic data-transformation

41

Как вывести решение о регрессии гребня?

У меня возникли некоторые проблемы с выводом решения для регрессии гребня. Я знаю регрессионное решение без условия регуляризации: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. Но после добавления термина L2 к функции стоимости, получается решениеλ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2...

regression least-squares regularization ridge-regression

41

Чем оценки склонности отличаются от добавления ковариат в регрессии, и когда они предпочтительнее последней?

Я признаю, что я относительно новичок в оценках предрасположенности и причинного анализа. Одна вещь, которая не очевидна для меня как новичка, заключается в том, как «балансировка» с использованием показателей склонности математически отличается от того, что происходит, когда мы добавляем ковариаты...

regression multivariate-analysis causality propensity-scores

40

Как представить результаты Лассо, используя glmnet?

Я хотел бы найти предикторы для непрерывной зависимой переменной из набора из 30 независимых переменных. Я использую регрессию Лассо, как это реализовано в пакете glmnet в R. Вот некоторый фиктивный код: # generate a dummy dataset with 30 predictors (10 useful & 20 useless) y=rnorm(100)...

r multiple-regression lasso glmnet communication