Вопросы с тегом «robust»

Надежность в целом относится к нечувствительности статистики к отклонениям от ее базовых предположений (Huber and Ronchetti, 2009).

82
Почему надежная (и устойчивая) статистика не заменила классические методы?

При решении бизнес-задач с использованием данных обычно используется хотя бы одно ключевое предположение о том, что подкрепляющая классическая статистика недопустима. В большинстве случаев никто не удосуживается проверить эти предположения, поэтому вы никогда не узнаете. Например, то, что многие из...

52
Почему мы так заботимся о нормально распределенных членах ошибки (и гомоскедастичности) в линейной регрессии, когда нам это не нужно?

Я полагаю, что расстраиваюсь каждый раз, когда слышу, как кто-то говорит, что ненормальность остатков и / или гетероскедастичность нарушают допущения OLS. Для оценки параметров в модели МНК ни одно из этих предположений не является необходимым по теореме Гаусса-Маркова. Я вижу, как это важно в...

50
Быстрая линейная регрессия, устойчивая к выбросам

Я имею дело с линейными данными с выбросами, некоторые из которых находятся на расстоянии более 5 стандартных отклонений от расчетной линии регрессии. Я ищу технику линейной регрессии, которая уменьшает влияние этих точек. Пока что я сделал, чтобы оценить линию регрессии со всеми данными, затем...

39
Репликация «надежного» параметра Stata в R

Я пытался повторить результаты опции Stata robustв R. Я использовал rlmкоманду из пакета MASS, а также команду lmrobиз пакета "robustbase". В обоих случаях результаты сильно отличаются от «надежного» параметра в Stata. Кто-нибудь может предложить что-то в этом контексте? Вот результаты, которые я...

32
Какой будет надежная байесовская модель для оценки масштаба примерно нормального распределения?

Существует ряд надежных оценок масштаба . Ярким примером является медианой абсолютное отклонение , которое относится к стандартному отклонению , как σ=MAD⋅1.4826σ=MAD⋅1.4826\sigma = \mathrm{MAD}\cdot1.4826 . В байесовской структуре существует ряд способов надежной оценки местоположения примерно...

31
Замена выбросов на среднее

Этот вопрос был задан моим другом, который не разбирается в Интернете. У меня нет статистики, и я искал в интернете этот вопрос. Вопрос в том, можно ли заменить выбросы средним значением? если это возможно, есть ли какие-либо книги / журналы, чтобы подтвердить это...

30
Являются ли 50% доверительные интервалы более достоверными, чем 95% доверительные интервалы?

Мой вопрос вытекает из этого комментария к сообщению в блоге Эндрю Гельмана, в котором он выступает за использование 50% -ных доверительных интервалов вместо 95% -ных доверительных интервалов, хотя не на том основании, что они более надежно оценены: Я предпочитаю интервалы от 50% до 95% по 3...

30
Почему мы должны использовать t ошибок вместо обычных ошибок?

В этом посте Эндрю Гельмана есть следующий отрывок: Байесовские модели 50-летней давности кажутся безнадежно простыми (за исключением, конечно, простых задач), и я ожидаю, что сегодняшние байесовские модели будут казаться безнадежно простыми, спустя 50 лет. (Просто для простого примера: мы,...

29
Ошибка «система вычислительно единственная» при запуске GLM

Я использую пакет robustbase для запуска оценки glm. Однако, когда я делаю это, я получаю следующую ошибку: Error in solve.default(crossprod(X, DiagB * X)/nobs, EEq) : system is computationally singular: reciprocal condition number = 1.66807e-16 Что это значит / указывает? И как я могу это...

26
Почему RANSAC не наиболее широко используется в статистике?

Исходя из области компьютерного зрения, я часто использовал метод RANSAC (Random Sample Consensus) для подгонки моделей к данным с большим количеством выбросов. Тем не менее, я никогда не видел, чтобы он использовался статистиками, и у меня всегда было впечатление, что его не считают «статистически...

24
Насколько надежен независимый выборочный t-критерий, когда распределение образцов ненормальное?

Я читал, что t- тест является «достаточно надежным», когда распределение выборок отклоняется от нормального. Конечно, важны именно выборочные распределения различий. У меня есть данные для двух групп. Одна из групп сильно отклонена от зависимой переменной. Размер выборки довольно мал для обеих...

21
Как спроецировать новый вектор на пространство PCA?

После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли...

19
Является ли взвешенный

Я оценил надежную линейную модель Rс весами ММ, используя rlm()пакет MASS. `R`` не предоставляет значение для модели, но я хотел бы иметь его, если это значимое количество. Мне также интересно знать, есть ли смысл иметь значение которое взвешивает общую и остаточную дисперсию так же, как...

18
Какие надежные методы корреляции действительно используются?

Я планирую провести симуляционное исследование, в котором сравниваю эффективность нескольких надежных методов корреляции с различными распределениями (искаженное, с выбросами и т. Д.). Под устойчивым я имею в виду идеальный случай быть устойчивым к: а) перекосам, б) выбросам и в) тяжелым хвостам....

18
Среднее и Медианное свойства

Может кто-нибудь объяснить мне ясную математическую логику, которая связывает два утверждения (а) и (б) вместе? Давайте иметь набор значений (некоторое распределение). Сейчас, а) Медиана не зависит от каждого значения [оно зависит только от одного или двух средних значений]; б) Медиана - это локус...

17
Надежный PCA против надежного расстояния Махаланобиса для обнаружения выбросов

Надежный PCA (разработанный Candes et al. 2009 или более поздней версии Netrepalli et al 2014 ) является популярным методом многомерного обнаружения выбросов , но расстояние Махаланобиса также можно использовать для обнаружения выбросов с помощью надежной регуляризованной оценки ковариационной...

17
Надежные методы действительно лучше?

У меня есть две группы субъектов, A и B, каждая из которых имеет размер около 400 и около 300 предикторов. Моя цель - построить модель прогнозирования для бинарной переменной ответа. Мой клиент хочет увидеть результат применения модели, построенной из A на B. (В своей книге «Стратегии...

17
Т-распределение Фиттинга в R: параметр масштабирования

Как мне подобрать параметры t-распределения, то есть параметры, соответствующие «среднему» и «стандартному отклонению» нормального распределения. Я предполагаю, что они называются «среднее» и «масштабирование / степени свободы» для t-распределения? Следующий код часто приводит к ошибкам «сбой...

17
Надежный t-критерий для среднего

Я пытаюсь проверить нулевое значение сравнении с локальной альтернативой E [ X ] > 0 для случайной величины X , подверженной небольшому или среднему перекосу и эксцессу случайной величины. Следуя предложениям Уилкокса в «Введении в робастную оценку и проверку гипотез», я рассмотрел тесты,...

16
Определение и сходимость итеративно переоцененных наименьших квадратов

Я использовал итеративно переоцененные наименьшие квадраты (IRLS), чтобы минимизировать функции следующей формы, J(m)=∑Ni=1ρ(|xi−m|)J(m)=∑i=1Nρ(|xi−m|)J(m) = \sum_{i=1}^{N} \rho \left(\left| x_i - m \right|\right) где NNN - количество экземпляров xi∈Rxi∈Rx_i \in \mathbb{R} , m∈Rm∈Rm \in \mathbb{R}...