Вопросы с тегом «regression»

10
Регуляризация нормы и нормы эмпирического исследования

Существует много способов выполнения регуляризации - например, регуляризация на основе норм , и . Согласно Friedman Hastie & Tibsharani , лучший регуляризатор зависит от проблемы: а именно от природы истинной целевой функции, конкретной используемой основы, отношения сигнал / шум и размера...

10
Что означают взаимодействия сплайн и не сплайн терминов?

Если я подгоняю свои данные к чему-то вроде lm(y~a*b), в синтаксисе R, где aэто двоичная переменная и bчисловая переменная, то a:bтермин взаимодействия - это разница между наклоном y~bat a= 0 и at a= 1. Теперь, скажем, отношения между yи bкриволинейные. Если я сейчас подхожу lm(y~a*poly(b,2)), то...

10
Что такое модель временного ряда для прогнозирования процентного соотношения (0,1)?

Это должно прийти вверх - прогнозирование вещей, которые застряли между 0 и 1. В моей серии я подозреваю, что компонент авторегрессии, а также компонент среднего обращения, поэтому я хочу что-то, что я могу интерпретировать, как ARIMA - но я не хочу, чтобы в будущем он снизился до 1000% , Вы просто...

10
Допустимо ли использовать две линейные модели на одном наборе данных?

Для линейной регрессии с несколькими группами (естественные группы определены априори) допустимо ли запускать две разные модели на одном наборе данных, чтобы ответить на следующие два вопроса? Есть ли в каждой группе ненулевой наклон и ненулевой перехват, и каковы параметры для каждой из них в...

10
Есть ли обобщение следа Пиллая и следа Хотеллинга-Лоули?

В условиях многомерной множественной регрессии (векторный регрессор и регрессия) четыре основных критерия общей гипотезы (лямбда Вилка, Пиллаи-Бартлетт, Хотеллинг-Лоули и самый большой корень Роя) зависят от собственных значений матрицы , где H и E - «объясненная» и «общая» вариационные...

10
Возможный диапазон

Предположим, есть три временных ряда, Икс1X1X_1 , Икс2X2X_2 и YYY Запуск обычной линейной регрессии на YYY ~ Икс1X1X_1 ( Y= B X1+ б0+ ϵY=bX1+b0+ϵY = b X_1 + b_0 + \epsilon ), получаем р2= UR2=UR^2 = U . Обычная линейная регрессия YYY ~ Икс2X2X_2 Get р2= VR2=VR^2 = V . Предположим, U< VU<VU <...

10
Лучший способ объединить двоичный и непрерывный ответ

Я пытаюсь найти лучший способ предсказать сумму платежа для агентства по сбору платежей. Зависимая переменная отлична от нуля только тогда, когда был произведен платеж. Понятно, что существует огромное количество нулей, потому что большинство людей не могут быть достигнуты или не могут погасить...

10
Зачем использовать контрольные переменные в различиях?

У меня есть вопрос о подходе «различия в различиях» со следующим стандартным уравнением: где Treat - фиктивная переменная для группы лечения и post. y=a+b1treat+b2post+b3treat⋅post+uy=a+b1treat+b2post+b3treat⋅post+u y= a + b_1\text{treat}+ b_2\text{post} + b_3\text{treat}\cdot\text{post} + u Теперь...

10
Редуцирующая регуляризация для стохастических матриц

Хорошо известно (например, в области измерения сжатия), что норма является «вызывающей разреженность» в том смысле, что если минимизировать функционал (для фиксированной матрицы и вектора ), для достаточно большого размера \ lambda> 0 , у многих вариантов A , \ vec {b} и \ lambda, вероятно,...

10
Коэффициент экспоненциальной логистической регрессии отличается от отношения шансов

Насколько я понимаю, возведенное в степень значение бета из логистической регрессии - это отношение шансов этой переменной для зависимой переменной, представляющей интерес. Однако это значение не соответствует рассчитанному вручную коэффициенту шансов. Моя модель предсказывает задержку роста...

10
Является ли мультиколлинеарность неявной в категориальных переменных?

Я заметил, что во время работы с моделью многомерной регрессии наблюдался небольшой, но заметный эффект мультиколлинеарности, измеряемый коэффициентами инфляции дисперсии, в категориях категориальной переменной (конечно, после исключения эталонной категории). Например, скажем, у нас есть набор...

10
Почему Anova () и drop1 () предоставили разные ответы для GLMM?

У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние...

10
Как бороться со смертью в анализе выживаемости без болезней?

Если у меня есть данные о выживаемости без заболевания (определяется как то, было ли диагностировано конкретное заболевание или нет, а также время до этого события или потери), а также общие данные о выживании, как мне поступить со смертельными случаями, которые происходят без событие болезни? Они...

10
Как я могу смоделировать пропорции с BUGS / JAGS / STAN?

Я пытаюсь построить модель, в которой ответ является пропорцией (фактически это доля голосов, которую партия получает в избирательных округах). Его распределение не является нормальным, поэтому я решил смоделировать его с помощью бета-версии. У меня также есть несколько предикторов. Однако я не...

10
Как интерпретировать коэффициенты многомерной смешанной модели в lme4 без общего перехвата?

Я пытаюсь вписать многомерную (то есть множественную реакцию) смешанную модель R. Помимо ASReml-rи SabreRпакетов (которые требуют внешнего программного обеспечения), то кажется , что это возможно только в MCMCglmm. В документе, который сопровождает MCMCglmmпакет (стр. 6), Джаррод Хэдфилд описывает...

10
Графики в регрессионном разрыве дизайна в «Stata» или «R»

Lee и Lemieux (стр. 31, 2009) предлагают исследователю представить графики при выполнении анализа разрыва непрерывности регрессии (RDD). Они предлагают следующую процедуру: «... для некоторой полосы пропускания и для некоторого числа бинов и слева и справа от значения отсечки, соответственно, идея...

10
Влиятельный остаток против выброса

Во-первых, я должен заявить, что я искал на этом сайте ответ. Либо я не нашел вопрос, который ответил на мой вопрос, либо мой уровень знаний настолько низок, что я не понял, что уже прочитал ответ. Я готовлюсь к экзамену по статистике AP. Я должен изучить линейную регрессию, и одна из тем -...

10
В чем разница между логит-трансформированной линейной регрессией, логистической регрессией и логистической смешанной моделью?

Предположим, у меня есть 10 учеников, каждый из которых пытается решить 20 математических задач. Задачи оцениваются правильно или неправильно (в длинных данных), и результаты каждого учащегося можно суммировать с помощью показателя точности (в подчиненных данных). Модели 1, 2 и 4 ниже дают разные...

10
Как проверить, хороша ли моя регрессионная модель

Один из способов найти точность модели логистической регрессии с использованием «glm» - это найти график AUC. Как проверить то же самое для регрессионной модели, найденной с переменной непрерывного ответа (family = 'gaussian')? Какие методы используются для проверки соответствия моей регрессионной...

10
В чем преимущество вменения перед построением нескольких моделей в регрессии?

Интересно, может ли кто-нибудь дать некоторое представление о том, является ли лучше объяснение почему отсутствующие данные, чем простое построение различных моделей для случаев с отсутствующими данными. Особенно в случае [обобщенных] линейных моделей (возможно, я вижу, что в нелинейных случаях все...