Я знаю, что в линейной регрессии переменная отклика должна быть непрерывной, но почему это так? Кажется, я не могу найти в Интернете ничего, что объясняет, почему я не могу использовать дискретные данные для переменной...
Я знаю, что в линейной регрессии переменная отклика должна быть непрерывной, но почему это так? Кажется, я не могу найти в Интернете ничего, что объясняет, почему я не могу использовать дискретные данные для переменной...
норма является уникальной (по крайней мере частично) , потому что находится на границе между невыпуклые и выпуклы. норма является «наиболее разреженным» выпуклая норма (правда?).L1L1L_1p=1p=1p=1L1L1L_1 Я понимаю, что евклидова норма имеет корни в геометрии и имеет четкую интерпретацию, когда...
Я читал этот вопрос о крупномасштабной регрессии ( ссылка ), где Уубер указал на интересный момент: «Практически любой выполняемый вами статистический тест будет настолько мощным, что почти наверняка будет выявлен« значительный »эффект. Вы должны уделять больше внимания статистической значимости,...
В последнее время мне пришлось читать несколько статей по экономике (область, с которой я не слишком знаком). Одна вещь, которую я заметил, это то, что даже когда переменная отклика является двоичной, модели линейной регрессии, использующие OLS, повсеместны. Поэтому мой вопрос: Почему линейная...
Я читаю о выборе лучшего подмножества в книге «Элементы статистического обучения». Если у меня есть 3 предиктора x1,x2,x3x1,x2,x3x_1,x_2,x_3 , я создаю подмножеств:23=823=82^3=8 Подмножество без предикторов подмножество с предикторомx1x1x_1 подмножество с предикторомx2x2x_2 подмножество с...
Я хочу построить регрессионную модель, которая представляет собой среднее из нескольких моделей OLS, каждая из которых основана на подмножестве полных данных. Идея, лежащая в основе этого, основана на этой статье . Я создаю k сгибов и строю k моделей OLS, каждая на основе данных без одного сгиба....
Регрессия yyy на xxx не должна быть причинной, если есть пропущенные переменные, которые влияют как на xxx и на yyy . Но если не для пропущенных переменных и ошибки измерения, является ли регрессия причиной? То есть, если каждая возможная переменная включена в...
В настоящее время я работаю над проблемой, в которой у нас небольшой набор данных, и меня интересует причинно-следственное влияние лечения на результат. Мой консультант поручил мне выполнить одномерную регрессию для каждого предиктора с результатом в качестве ответа, а затем назначением лечения в...
В Kahneman and Deaton (2010) † авторы пишут следующее:††^\dagger Эта регрессия объясняет 37% дисперсии с среднеквадратической ошибкой (RMSE) 0,67852. Чтобы исключить выбросы и отчеты о неправдоподобных доходах, мы отбросили наблюдения, в которых абсолютная величина разницы между доходом от журнала...
Когда вы будете склонны использовать кривые ROC над некоторыми другими тестами, чтобы определить прогнозирующую способность какого-либо измерения результата? При работе с дискретными результатами (живыми / мертвыми, присутствующими / отсутствующими), что делает кривые ROC более или менее мощными,...
Я унаследовал некоторый код анализа данных, который, не будучи эконометриком, я изо всех сил пытаюсь понять. Одна модель запускает регрессию инструментальных переменных с помощью следующей команды Stata ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv) Этот набор данных представляет...
Я подгоняю L1-регуляризованную линейную регрессию к очень большому набору данных (с n >> p.). Переменные известны заранее, но наблюдения приходят небольшими порциями. Я хотел бы поддерживать форму лассо после каждого куска. Я, очевидно, могу заново подогнать всю модель после просмотра каждого...
Есть ли хорошие статьи или книги, посвященные использованию координатного спуска для L1 (лассо) и / или упругой регуляризации сети для задач линейной
SVM для классификации имеют для меня интуитивный смысл: я понимаю, как минимизация дает максимальный запас. Однако я не понимаю эту цель в контексте регрессии. Различные тексты ( здесь и здесь ) описывают это как максимизацию «плоскостности». Зачем нам это делать? Что в регрессии эквивалентно...
Похоже, вы можете использовать кодирование для одной категориальной переменной, но у меня есть две категориальные и одна непрерывная переменная предиктора. Могу ли я использовать множественную регрессию для этого в SPSS и если да, то как?...
Я хотел бы поставить этот вопрос в двух частях. Оба имеют дело с обобщенной линейной моделью, но первый касается выбора модели, а другой - регуляризации. Справочная информация: Я использую модели GLM (линейная, логистическая, гамма-регрессия) как для прогнозирования, так и для описания. Когда я...
Скажем, - линейная функция от и фиктивная . Моя гипотеза состоит в том, что само по себе , как гедонистическому индексу вектора других переменных, . У меня есть поддержка для этого в из (т.е. , , ..., ) на . Есть ли способ проверить эквивалентность этих двух моделей:x d d Z M A N O V A Z z 1 z 2 z...
Весь смысл AIC или любого другого информационного критерия в том, что чем меньше, тем лучше. Поэтому, если у меня есть две модели M1: y = a0 + XA + e и M2: y = b0 + ZB + u, и если AIC первого (A1) меньше, чем у второго (A2), то M1 имеет лучше подходит с точки зрения теории информации. Но есть ли...
Из эконометрики Фумио Хаяси (Гл. 1): Безусловная гомоскедастичность: Второй момент ошибки членов E (εᵢ²) постоянен по наблюдениям Функциональная форма E (εᵢ² | xi) постоянна по наблюдениям Условная гомоскедастичность: Снято ограничение, что второй момент слагаемых ошибки E (εᵢ²) постоянен по...
В настоящее время я использую анализ основных компонентов, чтобы выбрать переменные для моделирования. В настоящий момент я делаю измерения A, B и C в своих экспериментах. Что я действительно хочу знать: могу ли я сделать меньше измерений и прекратить запись C и / B, чтобы сэкономить время и...