Вопросы с тегом «regression»

11

Когда наименьшие квадраты будут плохой идеей?

Если у меня есть модель регрессии: где и ,Y= Хβ+ εY=Xβ+ε Y = X\beta + \varepsilon V [ε]=Id∈ Rn × nV[ε]=Id∈Rn×n\mathbb{V}[\varepsilon] = Id \in \mathcal{R} ^{n \times n}E [ε]=(0,…,0)E[ε]=(0,…,0)\mathbb{E}[\varepsilon]=(0, \ldots , 0) когда использование , обычного метода наименьших квадратов , будет...

regression distributions least-squares

11

Допущение нормальности в линейной регрессии

В качестве допущения о линейной регрессии нормальность распределения ошибки иногда ошибочно «расширяется» или интерпретируется как необходимость нормальности y или x. Можно ли построить сценарий / набор данных, где X и Y ненормальны, но ошибочный член есть, и, следовательно, полученные оценки...

regression linear-model assumptions

11

Могут ли (должны?) Методы регуляризации использоваться в модели случайных эффектов?

Под методами регуляризации я имею в виду лассо, ребристую регрессию, эластичную сеть и тому подобное. Рассмотрим прогностическую модель данных здравоохранения, содержащую демографические и диагностические данные, где прогнозируется продолжительность пребывания в стационаре. Для некоторых людей есть...

multiple-regression random-effects-model regularization

11

Как выбрать вероятность отсечения для редкого события Логистическая регрессия

У меня есть 100 000 наблюдений (9 фиктивных переменных индикатора) с 1000 положительных результатов. Логистическая регрессия должна работать нормально в этом случае, но вероятность отсечения озадачивает меня. В обычной литературе мы выбираем 50% -ное сокращение, чтобы предсказать 1 и 0. Я не могу...

regression logistic classification generalized-linear-model roc

11

Как инструментальные переменные решают проблему смещения выбора?

Мне интересно, как инструментальная переменная решает проблему смещения выбора в регрессии. Вот пример, который я пережевываю: В « Эконометрии в основном безвредных» авторы обсуждают регрессию IV, касающуюся военной службы и доходов в более позднем возрасте. Вопрос в том, увеличивает ли служба в...

regression econometrics bias causality instrumental-variables

11

Проверка, существенно ли отличаются два коэффициента регрессии (в идеале R)

Если это дублирующий вопрос, пожалуйста, укажите правильный путь, но похожие вопросы, которые я нашел здесь, не были достаточно похожими. Предположим, я оцениваю модельY= α + βИкс+ тыY=α+βX+uY=\alpha + \beta X + u и найдите, что . Однако оказывается, что , и я подозреваю, что , и, в частности, что...

r regression hypothesis-testing econometrics

11

Разница между ep-SVR и nu-SVR (и методом наименьших квадратов SVR)

Я пытаюсь выяснить, какой SVR подходит для такого рода данных. Я знаю 4 типа СВР: эпсилон ню наименьших квадратов и линейно. Я понимаю, что линейный SVR более или менее похож на лассо с L1 Reg, но в чем разница между оставшимися 3 методами?...

regression svm

11

Логистическая регрессия: интерпретация непрерывных переменных

У меня было несколько вопросов о том, как интерпретировать отношения шансов для непрерывных переменных в логистической регрессии. Я чувствую, что это основные вопросы о логистической регрессии (и, вероятно, о регрессии в целом), и, хотя мне немного стыдно, что я не знаю ответов, я проглочу свою...

regression logistic

11

Каковы проблемы с использованием процентного результата в линейной регрессии?

У меня есть исследование, в котором многие результаты представлены в виде процентов, и я использую множественные линейные регрессии, чтобы оценить влияние некоторых категориальных переменных на эти результаты. Мне было интересно, поскольку линейная регрессия предполагает, что результатом является...

regression ratio percentage

11

Обнаружение выбросов с использованием регрессии

Может ли регрессия использоваться для внешнего обнаружения. Я понимаю, что существуют способы улучшить регрессионную модель путем устранения выбросов. Но основная цель здесь не в том, чтобы подогнать регрессионную модель, а в том, чтобы выяснить, кто использует...

regression outliers

11

Являются ли оценки коэффициентов регрессии некоррелированными?

Рассмотрим простую регрессию (нормальность не предполагается): где со средним и стандартным отклонением . Являются ли оценки наименьших квадратов и некоррелированными?Yi=a+bXi+ei,Yi=a+bXi+ei,Y_i = a + b X_i +...

regression correlation estimation

11

Функция передачи вмешательства ARIMA - как визуализировать эффект

У меня есть месячные временные ряды с вмешательством, и я хотел бы количественно оценить влияние этого вмешательства на результат. Я понимаю, что серия довольно короткая, и эффект еще не завершен. Данные cds <- structure(c(2580L, 2263L, 3679L, 3461L, 3645L, 3716L, 3955L, 3362L, 2637L, 2524L,...

r regression arima intervention-analysis

11

Статистика теста Дурбина Уотсона

Я применил тест DW к моей регрессионной модели в R, и я получил статистику теста DW 1,78 и значение p 2,2e-16 = 0. Означает ли это, что не существует автокорреляции между невязками, потому что stat близок к 2 с небольшим p-значением, или это означает, что хотя stat близок к 2, p-значение мало, и...

r regression hypothesis-testing autocorrelation residuals

11

регрессия для угловых / круговых данных

Я контролировал проблему обучения, где цели - это углы. Если бы я выполнил простую регрессию, то числа 360 и 1 были бы далеко для моей модели, но на самом деле они близки и предсказывать координаты x и y нехорошо, так как я пытаюсь предсказать здесь только одно число. Как правильно решить эту...

regression circular-statistics

11

Обратное преобразование результатов регрессии при моделировании журнала (y)

Я подгоняю регрессию к . Является ли обоснованным обратное преобразование точечных оценок (и доверительных интервалов / интервалов прогнозирования) путем возведения в степень? Я не верю в это, поскольку но хотел мнения других.log(y)log⁡(y)\log(y)E[f(X)]≠f(E[X])E[f(X)]≠f(E[X])E[f(X)] \ne f(E[X]) Мой...

regression back-transformation

11

Как выполнить остаточный анализ для бинарных / дихотомических независимых предикторов в линейной регрессии?

Я выполняю множественную линейную регрессию ниже в R, чтобы предсказать доходность управляемого фонда. reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) Здесь только GRI и MBA являются бинарными / дихотомическими предикторами; остальные предикторы являются непрерывными. Я использую этот...

r multiple-regression categorical-data heteroscedasticity residuals

11

Квадратичное программирование и лассо

Я пытаюсь выполнить регрессию лассо, которая имеет следующую форму: Минимизируйте вwww(Y−Xw)′(Y−Xw)+λ|w|1(Y−Xw)′(Y−Xw)+λ|w|1(Y - Xw)'(Y - Xw) + \lambda \;|w|_1 Учитывая , мне посоветовали найти оптимальное с помощью квадратичного программирования, которое принимает следующую форму:λλ\lambdawww...

regression lasso quadratic-form

11

Использование стандартных инструментов машинного обучения для данных с левой цензурой

Я разрабатываю приложение для прогнозирования, цель которого - позволить импортеру прогнозировать спрос на свою продукцию от своей сети дистрибьюторов. Данные о продажах являются довольно хорошим показателем спроса, если имеется достаточный запас для удовлетворения спроса. Однако, когда инвентарь...

r regression machine-learning censoring

11

В чем разница между контролем переменной в регрессионной модели и контролем переменной в проекте исследования?

Я полагаю, что контроль переменной в вашем проекте исследования более эффективен для уменьшения ошибки, чем контроль за ней в вашей регрессионной модели. Не возражает ли кто-нибудь формально объяснить, как эти два случая «контроля» различаются? Насколько они сравнительно эффективны для уменьшения...

regression experiment-design controlling-for-a-variable

11

Сверхдисперсия и недисперсия в отрицательной биномиальной / пуассоновской регрессии

Я выполнял регрессию Пуассона в SAS и обнаружил, что значение хи-квадрат Пирсона, деленное на степени свободы, составляло около 5, что указывает на значительную избыточную дисперсию. Итак, я сопоставил отрицательную биномиальную модель с proc genmod и обнаружил, что значение хи-квадрат Пирсона,...

regression binomial underdispersion