Необработанные остатки по сравнению со стандартизованными остатками по сравнению со студентизированными остатками - что использовать, когда?

31

Это похоже на похожий вопрос и не получил много ответов.

Пропуская такие тесты, как D Кука, и просто рассматривая остатки как группу, мне интересно, как другие используют остатки при оценке пригодности. Я использую сырые остатки:

  1. в QQ-сюжете, для оценки нормальности
  2. на диаграмме рассеяния сравнению с остатками для проверки глазного яблока (а) гетероскедастичности и (б) последовательной автокорреляции.y

Для построения графика зависимости от остатков для изучения значений где могут возникать выбросы, я предпочитаю использовать изученные остатки . Причиной моего предпочтения является то, что она позволяет легко просматривать, какие остатки, при которых значения являются проблематичными, хотя стандартизированные остатки дают чрезвычайно похожий результат. Моя теория о том, что используется, состоит в том, что это зависит от того, в какой университет поступилyyy

Это похоже на то, как другие используют остатки? Используют ли другие это количество графиков в сочетании со сводной статистикой?

Мишель
источник
3
Изученные остатки, несомненно, лучше обнаруживают выбросы и, возможно, немного лучше при проверке гетероскедастичности. Для других целей мне не важно, какие остатки использовать.
ttnphns
Чтобы привлечь внимание к вопросу, Мишель, или попросить изменить его статус (например, CW), перейдите по ссылке «флажок» под вопросом. Это автоматически уведомит всех модераторов. Встраивание запросов в вопросы, комментарии или ответы является случайным, потому что оно основано на надежде, что модератор (или другой пользователь с высоким уровнем повторения) действительно прочитает его в течение разумного времени!
whuber
@ whuber А, видишь, я действительно думал, что один из вас прочтет это в конце :) Спасибо за совет по использованию флагов.
Мишель
1
Привет @ttnphns Почему бы им быть лучше? В частности, почему студент должен быть лучше, чем стандартизированный? (Я никогда не знал ответа здесь)
Питер Флом - Восстановить Монику
4
@Peter, Studentized остатки менее "искажены" алгоритмом подгонки OLS и ближе к теоретическому понятию "ошибок" . Их можно сравнивать непосредственно в разных областях линии соответствия, поэтому они лучше принимают решение, если точка является выбросом.
ttnphns

Ответы:

8

Это не столько ответ, сколько разъяснение терминологии. Ваш вопрос касается необработанных, стандартизированных и изученных остатков. Тем не менее, это не терминология, используемая большинством статистиков, хотя я отмечаю, что ваши замечания класса утверждают, что это так.

Сырье: так же, как у вас есть.

Стандартизированный: это фактически необработанные остатки, разделенные на истинное стандартное отклонение остатков. Поскольку истинное стандартное отклонение редко известно, стандартизированный остаток почти никогда не используется.

Внутренне изучено: поскольку истинное стандартное отклонение от остатков обычно не известно, вместо него используется расчетное стандартное отклонение. Это внутренне изученный остаток, и это то, что вы назвали стандартизированным.

Внешне изученные: то же самое, что и внутренне изученные остатки, за исключением того, что оценка стандартного отклонения от остатков рассчитывается по регрессии, исключая данное наблюдение.

Пирсон: необработанный остаток, деленный на стандартное отклонение переменной отклика (переменная y), а не остатков. У вас нет этого в списке.

«пропустить одно»: не имеет формального имени, но оно совпадает с примечаниями класса.

стандартизированный "оставь один": также не имеет формального имени, но это не то, что в примечаниях к классу называют студенческим.

Источники:

  1. та же ссылка на вики, что и у вас, о вычеркнутых остатках («вычтенный остаток - это коэффициент, полученный в результате деления остатка на оценку его стандартного отклонения»)

  2. документация для остаточного расчета в САС

Майкл Куни
источник
2
+1 Конечно, некоторые статистики использовали термины в вопросе ОП (и не всегда совершенно согласованно с другими, использующими те же слова). Я думаю, что используемые вами термины становятся все более распространенными, но я не уверен, на каком основании мы могли бы догадаться об их относительно общемировом использовании среди статистиков - например, статьи не обязательно помогают, потому что средний статистик не будет активно издательский. Вы можете быть правы - но как бы мы узнали? [Если вам случится редактировать снова, вы можете заменить «стандартизированный» в конце на «стандартизированный».]
Glen_b
2

Re: участки,

Существует такая вещь, как переоснащение, но излишняя прокладка не может принести много вреда, особенно на этапе диагностики. Стандартизированный график нормальной вероятности не может повредить рядом с вашим QQ-графиком. Я считаю, что лучше оценить середину распределения.

Re: остатки,

Я запускаю как стандартизированные, так и изученные остатки на стадии черновика и обычно заканчиваю кодировать стандартизированные. Я не знаю, что на самом деле делают другие люди, потому что диагностика действительно записана в материале репликации, который я нахожу в Интернете.

Re: диагностика,

vifhettestR2

Fr.
источник