Вопросы с тегом «residuals»

25
Диагностика для обобщенных линейных (смешанных) моделей (особенно остатков)

В настоящее время я пытаюсь найти подходящую модель для сложных данных подсчета (зависимая переменная). Я пробовал различные модели (модели смешанных эффектов необходимы для моего вида данных), такие как lmerи lme4(с лог-преобразованием), а также обобщенные линейные модели смешанных эффектов с...

22
Допущения о линейных моделях и что делать, если остатки не распределены нормально

Я немного запутался в предположениях о линейной регрессии. До сих пор я проверял: все объясняющие переменные линейно коррелировали с переменной отклика. (Это было так) была какая-то коллинеарность среди объясняющих переменных. (была небольшая коллинеарность). расстояния Кука точек данных моей...

21
Почему нормальность остатков «едва важна вообще» для оценки линии регрессии?

Гельман и Хилл (2006) пишут на стр. 46, что: Предположение регрессии, которое обычно наименее важно, состоит в том, что ошибки обычно распределяются. Фактически, для оценки линии регрессии (по сравнению с прогнозированием отдельных точек данных) предположение о нормальности едва ли вообще важно....

21
В простой линейной регрессии, откуда берется формула для дисперсии остатков?

Согласно тексту, который я использую, формула для дисперсии остатка определяется как:ithithi^{th} σ2(1−1n−(xi−x¯¯¯)2Sxx)σ2(1−1n−(xi−x¯)2Sxx)\sigma^2\left ( 1-\frac{1}{n}-\frac{(x_{i}-\overline{x})^2}{S_{xx}} \right ) Я нахожу это трудно поверить , так как остаточная разница между наблюдаемым...

21
Остаточная диагностика в регрессионных моделях на основе MCMC

Недавно я приступил к подгонке регрессионно-смешанных моделей в байесовской структуре, используя алгоритм MCMC (функция MCMCglmm в R на самом деле). Я полагаю, что я понял, как диагностировать сходимость процесса оценки (след, график Гьюке, автокорреляция, апостериорное распределение ...). Одна из...

21
Как работают узкие места в нейронных сетях?

Мы определяем архитектуру узких мест как тип, найденный в статье ResNet, где [два конвексных слоя 3x3] заменяются на [один конв 1x1, один конв 3x3 и еще один слой конвекс 1x1]. Я понимаю, что конвексные слои 1x1 используются как форма уменьшения размеров (и восстановления), что объясняется в другом...

20
Остаточные графики: почему график в зависимости от установленных значений, а не наблюдаемых значений

В контексте регрессии OLS я понимаю, что остаточный график (в сравнении с установленными значениями) обычно рассматривается для проверки на постоянную дисперсию и оценки спецификации модели. Почему остатки отображаются в зависимости от подгонки, а не от значений ? Как информация отличается от этих...

20
Сэндвич оценщик интуиции

Википедия и виньетка R-сэндвич-пакетов дают хорошую информацию о допущениях, подтверждающих стандартные ошибки коэффициента OLS, и математических основах сэндвич-оценок. Мне все еще неясно, как решается проблема гетероскедастичности остатков, возможно потому, что я не совсем понимаю стандартную...

19
Как оценить подгонку биномиального GLMM с lme4 (> 1,0)?

У меня есть GLMM с биномиальным распределением и функцией logit link, и у меня есть ощущение, что важный аспект данных недостаточно хорошо представлен в модели. Чтобы проверить это, я хотел бы знать, хорошо ли данные описываются линейной функцией на шкале логита. Следовательно, я хотел бы знать,...

18
ЛАССО предположения

В сценарии регрессии LASSO, где Y= Xβ+ ϵYзнак равноИксβ+εy= X \beta + \epsilon , и оценки LASSO задаются следующей задачей оптимизации минβ| | Y- Хβ| | +τ| | β| |1минβ||Y-Иксβ||+τ||β||1 \min_\beta ||y - X \beta|| + \tau||\beta||_1 Существуют ли какие-либо предположения относительно распределения...

17
Сохраняются ли автокоррелированные остаточные структуры даже в моделях с соответствующими структурами корреляции и как выбрать лучшие модели?

контекст В этом вопросе используется R, но речь идет об общих статистических вопросах. Я анализирую влияние факторов смертности (% смертности от болезней и паразитов) на скорость роста популяции моли с течением времени, когда популяция личинок отбиралась из 12 мест один раз в год в течение 8 лет....

17
Подтверждение распределения остатков в линейной регрессии

Предположим, мы запустили простую линейную регрессию , сохранили невязки и нарисовали гистограмму распределения невязок. Если мы получим что-то похожее на знакомый дистрибутив, можем ли мы предположить, что наш термин ошибки имеет такое распределение? Скажем, если мы выяснили, что остатки похожи на...

16
Остатки Пирсона

Вопрос новичка об остатке Пирсона в контексте теста хи-квадрат на соответствие формы: Помимо статистики теста, chisq.testфункция R сообщает об остатке Пирсона: (obs - exp) / sqrt(exp) Я понимаю, почему смотреть на необработанную разницу между наблюдаемыми и ожидаемыми значениями не так...

16
Пирсон В.С. Остатки отклонений в логистической регрессии

Я знаю, что стандартизированные остатки Пирсона получены традиционным вероятностным способом: ri=yi−πiπi(1−πi)−−−−−−−−√ri=yi−πiπi(1−πi) r_i = \frac{y_i-\pi_i}{\sqrt{\pi_i(1-\pi_i)}} и Остаточные отклонения получаются более статистическим способом (вклад каждой точки в вероятность):...

16
Можно ли вообще рассортировать набор данных по размеру остатка и провести сравнение с двумя выборками?

Это то, что я вижу в качестве специального метода, и это мне кажется очень подозрительным, но, возможно, я что-то упустил. Я видел, как это делалось в множественной регрессии, но давайте просто сделаем это просто: yi=β0+β1xi+εiyi=β0+β1xi+εi y_{i} = \beta_{0} + \beta_{1} x_{i} + \varepsilon_{i}...

15
Какие варианты в модели пропорциональной регрессии рисков, когда остатки Шенфельда не хороши?

Я делаю пропорциональную регрессию рисков Кокса в R, используя coxphмножество переменных. Остатки Мартингейла выглядят великолепно, а остатки Шенфельда отлично подходят для ПОЧТИ всех переменных. Есть три переменные, чьи остатки Шенфельда не плоские, и природа переменных такова, что имеет смысл,...

15
Статистика Юнга-Бокса для остатков ARIMA в R: запутанные результаты испытаний

У меня есть временной ряд, который я пытаюсь прогнозировать, для которого я использовал сезонную модель ARIMA (0,0,0) (0,1,0) [12] (= fit2). Это отличается от того, что R предложил с auto.arima (R-вычисленный ARIMA (0,1,1) (0,1,0) [12] был бы более подходящим, я назвал его fit1). Тем не менее, в...