Вопросы с тегом «regression»

22

Как термин ошибки регрессии может быть когда-либо соотнесен с объясняющими переменными?

В первом предложении этой вики- страницы утверждается, что «В эконометрике возникает проблема эндогенности, когда объясняющая переменная соотносится с ошибочным термином. 1 » Мой вопрос в том, как это может произойти? Разве бета-версия регрессии не выбрана такой, что член ошибки ортогонален...

regression

22

Примеры расширенного регрессионного моделирования

Я ищу расширенное тематическое исследование линейной регрессии, иллюстрирующее шаги, необходимые для моделирования сложных, множественных нелинейных отношений с использованием GLM или OLS. На удивление трудно найти ресурсы, выходящие за рамки базовых школьных примеров: большинство книг, которые я...

multiple-regression generalized-linear-model data-transformation splines nonlinear

22

Общие статистические тесты как линейные модели

(ОБНОВЛЕНИЕ: я углубился в это и разместил результаты здесь ) Список названных статистических тестов огромен. Многие из общих тестов основаны на выводе из простых линейных моделей, например, t-критерий с одной выборкой - это просто y = β + ε, который проверяется на нулевой модели, y = μ + ε, т. Е....

regression correlation anova t-test linear-model

22

Отбрасывание одного из столбцов при использовании быстрого кодирования

Насколько я понимаю, в машинном обучении может возникнуть проблема, если ваш набор данных имеет сильно коррелированные функции, поскольку они эффективно кодируют одну и ту же информацию. Недавно кто-то указал, что когда вы выполняете однократное кодирование для категориальной переменной, вы...

regression machine-learning categorical-data discrete-data categorical-encoding

22

Понимание парадокса Симпсона: пример Эндрю Гельмана с регрессом доходов по полу и росту

Эндрю Гельман в одном из своих недавних постов в блоге говорит: Я не думаю, что для парадокса Симпсона необходимы контрфакты или потенциальные результаты. Я говорю это потому, что можно установить парадокс Симпсона с переменными, которыми нельзя манипулировать, или для которых манипуляции не...

regression interaction simpsons-paradox

22

AIC или p-значение: какой выбрать для выбора модели?

Я новичок в этой вещи R, но не уверен, какую модель выбрать. Я сделал пошаговую регрессию вперед, выбирая каждую переменную на основе самой низкой AIC. Я придумал 3 модели, в которых я не уверен, какая из них «лучшая». Model 1: Var1 (p=0.03) AIC=14.978 Model 2: Var1 (p=0.09) + Var2 (p=0.199) AIC =...

model-selection aic stepwise-regression

22

Выборка для несбалансированных данных в регрессии

Были хорошие вопросы об обработке несбалансированных данных в контексте классификации , но мне интересно, что люди делают, чтобы выбрать регрессию. Скажем, проблемный домен очень чувствителен к знаку, но лишь несколько чувствителен к величине цели. Однако величина достаточно важна, чтобы модель...

regression sampling unbalanced-classes

22

Тест Вальда в регрессии (OLS и GLM): распределение t- и z-распределения

Я понимаю, что критерий Вальда для коэффициентов регрессии основан на следующем свойстве, которое выполняется асимптотически (например, Вассерман (2006): Вся статистика , стр. 153, 214-215): Где обозначает предполагаемый коэффициент регрессии, обозначает стандартную ошибку коэффициента регрессии, а...

r regression hypothesis-testing generalized-linear-model

22

Пошаговая линейная алгебраическая вычисление регрессии наименьших квадратов

В качестве приквела к вопросу о линейно-смешанных моделях в R и для использования в качестве справочного материала для любителей статистики начального и среднего уровня, я решил опубликовать в качестве независимого «Q & A-style» шаги, связанные с «ручным» вычислением Коэффициенты и прогнозные...

r regression linear-model lm

22

Есть ли такая вещь, как скорректированный

Включив в статью модель квантильной регрессии, рецензенты хотят, чтобы я включил скорректированный в статью. Я рассчитал псевдо- R 2 s (из статьи JASA Коенкера и Мачадо 1999 года ) для трех интересующих меня квантилей для моего исследования.R2R2R^2R2R2R^2 Однако я никогда не слышал о...

goodness-of-fit r-squared quantile-regression

22

Мостовой штраф против упругой регуляризации

Некоторые штрафные функции и аппроксимации хорошо изучены, такие как LASSO ( L1L1L_1 ) и Ридж ( L2L2L_2 ) и их сравнение в регрессии. ∑∥βj∥γ∑‖βj‖γ\sum \|\beta_{j}\|^{\gamma}γ=1γ=1\gamma = 1γ=2γ=2\gamma = 2 Вэньцзян [ 1 ] сравнил штраф Бриджа, когда с LASSO, но я не смог найти сравнение с...

regression lasso regularization ridge-regression elastic-net

22

Стабильность модели при решении большой проблемы , small

Вступление: У меня есть набор данных с классической «большой p, маленький n проблема». Количество доступных выборок n = 150, а количество возможных предикторов p = 400. Результат - непрерывная переменная. Я хочу найти самые «важные» дескрипторы, то есть те, которые являются лучшими кандидатами для...

regression cross-validation model-selection feature-selection elastic-net

22

Почему Lars и Glmnet предлагают разные решения проблемы Лассо?

Я хочу лучше понять пакеты R Larsи Glmnet, которые используются для решения проблемы Лассо: (для переменных и выборок, см. www.stanford.edu/~hastie/Papers/glmnet.pdf на стр. 3)м я н( β0β) ∈ Rр + 1[ 12 NΣя = 1N( уя- β0- хTяβ)2+ λ | |β| |L1]мяN(β0β)∈рп+1[12NΣязнак...

r regression machine-learning lasso regularization

22

Регрессия для модели формы

У меня есть набор данных, который является статистикой с форума веб-обсуждения. Я смотрю на распределение количества ответов, которые должна иметь тема. В частности, я создал набор данных, в котором есть список ответов на темы, а затем - количество тем с таким количеством ответов....

r regression nonlinear-regression

22

Как определить достоверность предсказания нейронной сети?

Чтобы проиллюстрировать мой вопрос, предположим, что у меня есть тренировочный набор, где на входе есть уровень шума, а на выходе нет, например; # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] : [3.0]...

regression machine-learning neural-networks confidence-interval prediction-interval

22

Сырая или ортогональная полиномиальная регрессия?

Я хочу регрессировать переменную yyy на x,x2,…,x5x,x2,…,x5x,x^2,\ldots,x^5 . Должен ли я сделать это, используя сырые или ортогональные полиномы? Я посмотрел на вопрос на сайте, который касается этих вопросов, но я не совсем понимаю, в чем разница между их использованием. Почему я не могу просто...

r regression polynomial

22

Что такое «регрессия пониженного ранга»?

Я читал «Элементы статистического обучения» и не мог понять, что такое раздел 3.7 «Сжатие и выбор нескольких результатов». В нем говорится о RRR (регрессии пониженного ранга), и я могу только понять, что предпосылка заключается в обобщенной многомерной линейной модели, в которой коэффициенты...

regression multivariate-analysis dimensionality-reduction regularization reduced-rank-regression

21

Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

21

Лог-линейная регрессия против логистической регрессии

Может ли кто-нибудь предоставить четкий список различий между логарифмической регрессией и логистической регрессией? Я понимаю, что первая - это простая модель линейной регрессии, но я не знаю, когда следует использовать каждую из...

regression logistic logit log-linear

21

Разница между регрессионным анализом и дисперсионным анализом?

Этот вопрос был перенесен из Математического стека обмена, потому что на него можно ответить по перекрестной проверке. Мигрировал 7 лет назад . Сейчас я учусь регрессионному анализу и анализу отклонений. В регрессионном анализе у вас есть одна фиксированная переменная, и вы хотите знать, как...

regression