Вопросы с тегом «regression»

13
В линейной регрессии, почему переменная отклика должна быть непрерывной?

Я знаю, что в линейной регрессии переменная отклика должна быть непрерывной, но почему это так? Кажется, я не могу найти в Интернете ничего, что объясняет, почему я не могу использовать дискретные данные для переменной...

13
Нормы - Что особенного в?

норма является уникальной (по крайней мере частично) , потому что находится на границе между невыпуклые и выпуклы. норма является «наиболее разреженным» выпуклая норма (правда?).L1L1L_1p=1p=1p=1L1L1L_1 Я понимаю, что евклидова норма имеет корни в геометрии и имеет четкую интерпретацию, когда...

13
Что случилось со статистической значимостью в регрессии, когда размер данных гигантский?

Я читал этот вопрос о крупномасштабной регрессии ( ссылка ), где Уубер указал на интересный момент: «Практически любой выполняемый вами статистический тест будет настолько мощным, что почти наверняка будет выявлен« значительный »эффект. Вы должны уделять больше внимания статистической значимости,...

13
Почему исследователи в области экономики используют линейную регрессию для бинарных переменных отклика?

В последнее время мне пришлось читать несколько статей по экономике (область, с которой я не слишком знаком). Одна вещь, которую я заметил, это то, что даже когда переменная отклика является двоичной, модели линейной регрессии, использующие OLS, повсеместны. Поэтому мой вопрос: Почему линейная...

13
Почему выбор лучшего подмножества не является предпочтительным по сравнению с лассо?

Я читаю о выборе лучшего подмножества в книге «Элементы статистического обучения». Если у меня есть 3 предиктора x1,x2,x3x1,x2,x3x_1,x_2,x_3 , я создаю подмножеств:23=823=82^3=8 Подмножество без предикторов подмножество с предикторомx1x1x_1 подмножество с предикторомx2x2x_2 подмножество с...

13
Есть ли теоретическая проблема с усреднением коэффициентов регрессии для построения модели?

Я хочу построить регрессионную модель, которая представляет собой среднее из нескольких моделей OLS, каждая из которых основана на подмножестве полных данных. Идея, лежащая в основе этого, основана на этой статье . Я создаю k сгибов и строю k моделей OLS, каждая на основе данных без одного сгиба....

13
Является ли регрессия причиной, если нет пропущенных переменных?

Регрессия yyy на xxx не должна быть причинной, если есть пропущенные переменные, которые влияют как на xxx и на yyy . Но если не для пропущенных переменных и ошибки измерения, является ли регрессия причиной? То есть, если каждая возможная переменная включена в...

13
В чем смысл одномерной регрессии до многомерной регрессии?

В настоящее время я работаю над проблемой, в которой у нас небольшой набор данных, и меня интересует причинно-следственное влияние лечения на результат. Мой консультант поручил мне выполнить одномерную регрессию для каждого предиктора с результатом в качестве ответа, а затем назначением лечения в...

13
Отбрасывание выбросов на основе «2,5-кратного среднеквадратичного значения»

В Kahneman and Deaton (2010) † авторы пишут следующее:††^\dagger Эта регрессия объясняет 37% дисперсии с среднеквадратической ошибкой (RMSE) 0,67852. Чтобы исключить выбросы и отчеты о неправдоподобных доходах, мы отбросили наблюдения, в которых абсолютная величина разницы между доходом от журнала...

12
Что кривые ROC говорят вам, что традиционный вывод не будет?

Когда вы будете склонны использовать кривые ROC над некоторыми другими тестами, чтобы определить прогнозирующую способность какого-либо измерения результата? При работе с дискретными результатами (живыми / мертвыми, присутствующими / отсутствующими), что делает кривые ROC более или менее мощными,...

12
Зачем использовать DV с задержкой в ​​качестве инструментальной переменной?

Я унаследовал некоторый код анализа данных, который, не будучи эконометриком, я изо всех сил пытаюсь понять. Одна модель запускает регрессию инструментальных переменных с помощью следующей команды Stata ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv) Этот набор данных представляет...

12
Обновление лассо соответствует новым наблюдениям

Я подгоняю L1-регуляризованную линейную регрессию к очень большому набору данных (с n >> p.). Переменные известны заранее, но наблюдения приходят небольшими порциями. Я хотел бы поддерживать форму лассо после каждого куска. Я, очевидно, могу заново подогнать всю модель после просмотра каждого...

12
Понимание регрессии SVM: целевая функция и «плоскостность»

SVM для классификации имеют для меня интуитивный смысл: я понимаю, как минимизация дает максимальный запас. Однако я не понимаю эту цель в контексте регрессии. Различные тексты ( здесь и здесь ) описывают это как максимизацию «плоскостности». Зачем нам это делать? Что в регрессии эквивалентно...

12
Могу ли я использовать множественную регрессию, когда у меня смешаны категориальные и непрерывные предикторы?

Похоже, вы можете использовать кодирование для одной категориальной переменной, но у меня есть две категориальные и одна непрерывная переменная предиктора. Могу ли я использовать множественную регрессию для этого в SPSS и если да, то как?...

12
GLM после выбора модели или регуляризации

Я хотел бы поставить этот вопрос в двух частях. Оба имеют дело с обобщенной линейной моделью, но первый касается выбора модели, а другой - регуляризации. Справочная информация: Я использую модели GLM (линейная, логистическая, гамма-регрессия) как для прогнозирования, так и для описания. Когда я...

12
Проверка эквивалентности не вложенных моделей

Скажем, - линейная функция от и фиктивная . Моя гипотеза состоит в том, что само по себе , как гедонистическому индексу вектора других переменных, . У меня есть поддержка для этого в из (т.е. , , ..., ) на . Есть ли способ проверить эквивалентность этих двух моделей:x d d Z M A N O V A Z z 1 z 2 z...

12
Тестирование разницы в AIC двух не вложенных моделей

Весь смысл AIC или любого другого информационного критерия в том, что чем меньше, тем лучше. Поэтому, если у меня есть две модели M1: y = a0 + XA + e и M2: y = b0 + ZB + u, и если AIC первого (A1) меньше, чем у второго (A2), то M1 имеет лучше подходит с точки зрения теории информации. Но есть ли...

12
Условная гомоскедастичность против гетероскедастичности

Из эконометрики Фумио Хаяси (Гл. 1): Безусловная гомоскедастичность: Второй момент ошибки членов E (εᵢ²) постоянен по наблюдениям Функциональная форма E (εᵢ² | xi) постоянна по наблюдениям Условная гомоскедастичность: Снято ограничение, что второй момент слагаемых ошибки E (εᵢ²) постоянен по...

12
Как использовать анализ главных компонентов для выбора переменных для регрессии?

В настоящее время я использую анализ основных компонентов, чтобы выбрать переменные для моделирования. В настоящий момент я делаю измерения A, B и C в своих экспериментах. Что я действительно хочу знать: могу ли я сделать меньше измерений и прекратить запись C и / B, чтобы сэкономить время и...