Вопросы с тегом «regression»

13

В линейной регрессии, почему переменная отклика должна быть непрерывной?

Я знаю, что в линейной регрессии переменная отклика должна быть непрерывной, но почему это так? Кажется, я не могу найти в Интернете ничего, что объясняет, почему я не могу использовать дискретные данные для переменной...

regression linear

13

Нормы - Что особенного в?

норма является уникальной (по крайней мере частично) , потому что находится на границе между невыпуклые и выпуклы. норма является «наиболее разреженным» выпуклая норма (правда?).L1L1L_1p=1p=1p=1L1L1L_1 Я понимаю, что евклидова норма имеет корни в геометрии и имеет четкую интерпретацию, когда...

regression regularization sparse

13

Что случилось со статистической значимостью в регрессии, когда размер данных гигантский?

Я читал этот вопрос о крупномасштабной регрессии ( ссылка ), где Уубер указал на интересный момент: «Практически любой выполняемый вами статистический тест будет настолько мощным, что почти наверняка будет выявлен« значительный »эффект. Вы должны уделять больше внимания статистической значимости,...

regression statistical-significance

13

Почему исследователи в области экономики используют линейную регрессию для бинарных переменных отклика?

В последнее время мне пришлось читать несколько статей по экономике (область, с которой я не слишком знаком). Одна вещь, которую я заметил, это то, что даже когда переменная отклика является двоичной, модели линейной регрессии, использующие OLS, повсеместны. Поэтому мой вопрос: Почему линейная...

regression logistic econometrics

13

Почему выбор лучшего подмножества не является предпочтительным по сравнению с лассо?

Я читаю о выборе лучшего подмножества в книге «Элементы статистического обучения». Если у меня есть 3 предиктора x1,x2,x3x1,x2,x3x_1,x_2,x_3 , я создаю подмножеств:23=823=82^3=8 Подмножество без предикторов подмножество с предикторомx1x1x_1 подмножество с предикторомx2x2x_2 подмножество с...

regression feature-selection lasso bias-variance-tradeoff

13

Есть ли теоретическая проблема с усреднением коэффициентов регрессии для построения модели?

Я хочу построить регрессионную модель, которая представляет собой среднее из нескольких моделей OLS, каждая из которых основана на подмножестве полных данных. Идея, лежащая в основе этого, основана на этой статье . Я создаю k сгибов и строю k моделей OLS, каждая на основе данных без одного сгиба....

regression least-squares ensemble

13

Является ли регрессия причиной, если нет пропущенных переменных?

Регрессия yyy на xxx не должна быть причинной, если есть пропущенные переменные, которые влияют как на xxx и на yyy . Но если не для пропущенных переменных и ошибки измерения, является ли регрессия причиной? То есть, если каждая возможная переменная включена в...

regression bias causality

13

В чем смысл одномерной регрессии до многомерной регрессии?

В настоящее время я работаю над проблемой, в которой у нас небольшой набор данных, и меня интересует причинно-следственное влияние лечения на результат. Мой консультант поручил мне выполнить одномерную регрессию для каждого предиктора с результатом в качестве ответа, а затем назначением лечения в...

regression multivariate-analysis model-selection causality univariate

13

Отбрасывание выбросов на основе «2,5-кратного среднеквадратичного значения»

В Kahneman and Deaton (2010) † авторы пишут следующее:††^\dagger Эта регрессия объясняет 37% дисперсии с среднеквадратической ошибкой (RMSE) 0,67852. Чтобы исключить выбросы и отчеты о неправдоподобных доходах, мы отбросили наблюдения, в которых абсолютная величина разницы между доходом от журнала...

regression outliers

12

Что кривые ROC говорят вам, что традиционный вывод не будет?

Когда вы будете склонны использовать кривые ROC над некоторыми другими тестами, чтобы определить прогнозирующую способность какого-либо измерения результата? При работе с дискретными результатами (живыми / мертвыми, присутствующими / отсутствующими), что делает кривые ROC более или менее мощными,...

regression roc

12

Зачем использовать DV с задержкой в качестве инструментальной переменной?

Я унаследовал некоторый код анализа данных, который, не будучи эконометриком, я изо всех сил пытаюсь понять. Одна модель запускает регрессию инструментальных переменных с помощью следующей команды Stata ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv) Этот набор данных представляет...

regression stata instrumental-variables

12

Обновление лассо соответствует новым наблюдениям

Я подгоняю L1-регуляризованную линейную регрессию к очень большому набору данных (с n >> p.). Переменные известны заранее, но наблюдения приходят небольшими порциями. Я хотел бы поддерживать форму лассо после каждого куска. Я, очевидно, могу заново подогнать всю модель после просмотра каждого...

regression lasso

12

Координатный спуск для лассо или эластичной сетки

Есть ли хорошие статьи или книги, посвященные использованию координатного спуска для L1 (лассо) и / или упругой регуляризации сети для задач линейной

regression references lasso regularization elastic-net

12

Понимание регрессии SVM: целевая функция и «плоскостность»

SVM для классификации имеют для меня интуитивный смысл: я понимаю, как минимизация дает максимальный запас. Однако я не понимаю эту цель в контексте регрессии. Различные тексты ( здесь и здесь ) описывают это как максимизацию «плоскостности». Зачем нам это делать? Что в регрессии эквивалентно...

regression svm

12

Могу ли я использовать множественную регрессию, когда у меня смешаны категориальные и непрерывные предикторы?

Похоже, вы можете использовать кодирование для одной категориальной переменной, но у меня есть две категориальные и одна непрерывная переменная предиктора. Могу ли я использовать множественную регрессию для этого в SPSS и если да, то как?...

regression spss categorical-data continuous-data

12

GLM после выбора модели или регуляризации

Я хотел бы поставить этот вопрос в двух частях. Оба имеют дело с обобщенной линейной моделью, но первый касается выбора модели, а другой - регуляризации. Справочная информация: Я использую модели GLM (линейная, логистическая, гамма-регрессия) как для прогнозирования, так и для описания. Когда я...

regression model-selection regularization

12

Проверка эквивалентности не вложенных моделей

Скажем, - линейная функция от и фиктивная . Моя гипотеза состоит в том, что само по себе , как гедонистическому индексу вектора других переменных, . У меня есть поддержка для этого в из (т.е. , , ..., ) на . Есть ли способ проверить эквивалентность этих двух моделей:x d d Z M A N O V A Z z 1 z 2 z...

r hypothesis-testing regression model-selection

12

Тестирование разницы в AIC двух не вложенных моделей

Весь смысл AIC или любого другого информационного критерия в том, что чем меньше, тем лучше. Поэтому, если у меня есть две модели M1: y = a0 + XA + e и M2: y = b0 + ZB + u, и если AIC первого (A1) меньше, чем у второго (A2), то M1 имеет лучше подходит с точки зрения теории информации. Но есть ли...

regression aic

12

Условная гомоскедастичность против гетероскедастичности

Из эконометрики Фумио Хаяси (Гл. 1): Безусловная гомоскедастичность: Второй момент ошибки членов E (εᵢ²) постоянен по наблюдениям Функциональная форма E (εᵢ² | xi) постоянна по наблюдениям Условная гомоскедастичность: Снято ограничение, что второй момент слагаемых ошибки E (εᵢ²) постоянен по...

regression econometrics heteroscedasticity assumptions

12

Как использовать анализ главных компонентов для выбора переменных для регрессии?

В настоящее время я использую анализ основных компонентов, чтобы выбрать переменные для моделирования. В настоящий момент я делаю измерения A, B и C в своих экспериментах. Что я действительно хочу знать: могу ли я сделать меньше измерений и прекратить запись C и / B, чтобы сэкономить время и...

regression pca model-selection