Вопросы с тегом «residuals»

15
Какие варианты в модели пропорциональной регрессии рисков, когда остатки Шенфельда не хороши?

Я делаю пропорциональную регрессию рисков Кокса в R, используя coxphмножество переменных. Остатки Мартингейла выглядят великолепно, а остатки Шенфельда отлично подходят для ПОЧТИ всех переменных. Есть три переменные, чьи остатки Шенфельда не плоские, и природа переменных такова, что имеет смысл,...

14
Почему мы говорим «Остаточная стандартная ошибка»?

Стандартной ошибкой является оценочное стандартное отклонение оценки для параметра . & thetas ; & thetasσ^( θ^)σ^(θ^)\hat \sigma(\hat\theta)θ^θ^\hat\thetaθθ\theta Почему расчетное стандартное отклонение от остатков называется «остаточной стандартной ошибкой» (например, при выводе функции R...

14
Почему остатки в линейной регрессии всегда суммируются до нуля, когда включен перехват?

Я беру курс по моделям регрессии, и одно из свойств, предусмотренных для линейной регрессии, заключается в том, что при включении перехвата остатки всегда суммируются до нуля. Кто-нибудь может дать хорошее объяснение, почему это так?...

13
Семейство GLM представляет собой распределение переменной ответа или остатков?

Я обсуждал это с несколькими сотрудниками лаборатории, и мы обратились к нескольким источникам, но до сих пор не получили ответа: Когда мы говорим, что у GLM есть семейство пуассонов , скажем, мы говорим о распределении остатков или переменной отклика? Спорные вопросы Читая эту статью, она...

13
Оценка моделей логистической регрессии

Этот вопрос возникает из-за моей путаницы в том, как решить, достаточно ли хороша логистическая модель. У меня есть модели, которые используют состояние пар индивидуальный проект через два года после их формирования в качестве зависимой переменной. Результат успешен (1) или нет (0). У меня есть...

13
Остаточная автокорреляция по сравнению с лаговой зависимой переменной

При моделировании временных рядов можно (1) смоделировать корреляционную структуру слагаемых ошибок, например, процесс AR (1) (2) включает в себя переменную с запаздыванием в качестве объясняющей переменной (справа) Я понимаю, что их иногда есть веские причины для (2). Однако, каковы...

13
R: проверить нормальность остатков линейной модели - какие остатки использовать

Я хотел бы сделать W-тест Шапиро Уилка и тест Колмогорова-Смирнова на невязках линейной модели, чтобы проверить на нормальность. Мне было просто интересно, какие остатки следует использовать для этого - необработанные остатки, остатки Пирсона, студентизированные остатки или стандартизированные...

13
Пакет GBM против Карет с использованием GBM

Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в...

13
Что означают нормальные остатки и что это говорит мне о моих данных?

Довольно простой вопрос: Что означает нормальное распределение остатков от линейной регрессии? С точки зрения того, как это отражается на моих исходных данных регрессии? Я в полном замешательстве, спасибо,...

12
Почему некоторые люди проверяют допущения регрессионных моделей на своих необработанных данных, а другие проверяют их на остаточных данных?

Я аспирант в области экспериментальной психологии, и я стараюсь улучшить свои навыки и знания о том, как анализировать мои данные. До пятого курса психологии я думал, что регрессионные модели (например, ANOVA) предполагают следующее: нормальность данных однородность дисперсии для данных и так далее...

12
Логистический регрессионный анализ остатков

Этот вопрос довольно общий и многословный, но, пожалуйста, потерпите меня. В моем приложении у меня есть много наборов данных, каждый из которых состоит из ~ 20 000 точек данных с ~ 50 объектами и одной зависимой двоичной переменной. Я пытаюсь смоделировать наборы данных с помощью регуляризованной...

12
Гетероскедастичность и нормальность остатков

Полагаю, у меня неплохая линейная регрессия (это для университетского проекта, поэтому мне не нужно быть очень точным). Дело в том, что если я построю график зависимости остатков от прогнозируемых значений, то (по словам моего учителя) есть намек на гетероскедастичность. Но если я нанесу QQ-график...

12
Точный критерий Фишера и гипергеометрическое распределение

Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст мешал....

12
Допущения остаточного распределения регрессии

Почему необходимо сделать предположение о распределении ошибок, т.е. ϵ i ∼ N ( 0 , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , с .ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Почему бы не написать у я ~ Н ( Х β , сг 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , с...

12
Как определить, что остатки автокоррелированы из графики

Когда вы делаете регрессию OLS и строите результирующие остатки, как вы можете определить, являются ли эти остатки автокоррелированными? Я знаю, что есть тесты для этого (Durbin, Breusch-Godfrey), но мне было интересно, можете ли вы просто посмотреть на график, чтобы оценить, может ли...

12
Являются ли нормально распределенные X и Y более вероятными в результате нормально распределенных остатков?

Здесь обсуждается неправильное толкование предположения о нормальности в линейной регрессии (что «нормальность» относится к X и / или Y, а не к остаткам), и автор спрашивает, возможно ли иметь ненормально распределенные X и Y и все еще имеют нормально распределенные остатки. Мой вопрос: нормально...

12
Как выполнить вменение значений в очень большом количестве точек данных?

У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000,...

12
Каково ожидаемое распределение остатков в обобщенной линейной модели?

Я выполняю обобщенную линейную модель, где я должен указать семью, отличную от нормальной. Каково ожидаемое распределение остатков? Например, должны ли остатки распределяться нормально?...

11
Диагональные прямые в графике остатков и подгоночных значений для множественной регрессии

Я наблюдаю странные закономерности в остатках для моих данных: [EDIT] Вот графики частичной регрессии для двух переменных: [EDIT2] Добавлен график PP Распределение, кажется, работает хорошо (см. Ниже), но я понятия не имею, откуда может идти эта прямая линия. Любые идеи? [ОБНОВЛЕНИЕ 31.07]...

11
Остатки Шенфельда

В модели пропорциональных рисков Кокса со многими переменными, если остатки Шенфельда не являются плоскими для одной из переменных, делает ли это недействительной всю модель или можно игнорировать только неэффективную переменную? То есть интерпретировать коэффициенты для других переменных, но не...