Я видел, что «остатки» по-разному определяются как «прогнозируемые минус фактические значения» или «фактические минус прогнозируемые значения». В целях иллюстрации, чтобы показать, что обе формулы широко используются, сравните следующие результаты веб-поиска:
На практике это почти никогда не имеет значения, так как знак невязочных остатков обычно не имеет значения (например, если они возведены в квадрат или взяты абсолютные значения). Тем не менее, мой вопрос таков: считается ли одна из этих двух версий (сначала предсказание против фактической сначала) «стандартной»? Мне нравится быть последовательным в моем использовании, поэтому, если есть общепризнанный общепринятый стандарт, я бы предпочел следовать ему. Однако, если нет стандарта, я с радостью приму это как ответ, если это будет убедительно продемонстрировано, что стандартного соглашения не существует.
источник
Ответы:
Остатки всегда фактические минус прогнозируемые. Модели: Следовательно, остатки е , которые являются оценками погрешности ε : ε = у - у
Я согласен с @whuber, что этот знак не имеет математического значения. Просто хорошо иметь конвенцию. И нынешняя конвенция такая же, как в моем ответе.
Поскольку ОП оспаривает мои полномочия по этому вопросу, я добавляю несколько ссылок:
источник
Я просто наткнулся вескими причинами для одного ответа быть правильной.
Синяя кривая соответствует обычному наименьшему квадрату. Он отображает установленные значения.
Это стандартный диагностический график, показывающий, как смещенные условные распределения зависят от прогнозируемых значений. Геометрически, это почти то же самое, что и "пока" на предыдущем графике рассеяния.
Это показывает те же величины, что и на предыдущем рисунке, но остатки были вычислены путем вычитания данных из их подгонки - что, конечно, то же самое, что отрицание предыдущих остатков.
Хотя обе предыдущие фигуры математически эквивалентны во всех отношениях - одна конвертируется в другую, просто переворачивая точки на голубом горизонте, - одна из них имеет гораздо более прямое визуальное отношение к исходному графику.
Следовательно, если наша цель состоит в том, чтобы связать характеристики распределения остатков с характеристиками исходных данных - и это почти всегда так - тогда лучше просто сместить ответы, чем смещать и обращать их вспять.
источник
Green & Tashman (2008, Foresight ) сообщает о небольшом опросе по аналогичному вопросу об ошибках прогноза. Я суммирую аргументы для любого соглашения, как они сообщают:
Аргументы в пользу "фактического предсказания"
По крайней мере, один респондент из сейсмологии написал, что это также соглашение для моделирования времени прохождения сейсмической волны. «Когда фактическая сейсмическая волна прибывает до времени, предсказанного моделью, мы имеем отрицательный остаток времени перемещения (ошибка)». ( так )
Аргументы за "предсказуемый-актуальный"
Соответственно, если положительное отклонение определено как положительные ожидаемые ошибки, это будет означать, что прогнозы в среднем слишком высоки с этим соглашением.
И это в значительной степени единственный аргумент в пользу этого соглашения. Опять же, учитывая недопонимание, к которому может привести другое соглашение (положительные ошибки = прогноз слишком низкий), оно является сильным.
В конце концов, я бы сказал, что все зависит от того, кому вы должны сообщить свои остатки. И, учитывая, что в этом обсуждении, безусловно, есть две стороны, имеет смысл четко указать, какое соглашение вы соблюдаете.
источник
Разная терминология предполагает разные условности. Термин «остаточный» подразумевает, что это то, что осталось после того, как все объясняющие переменные были приняты во внимание, то есть фактически предсказаны. «Ошибка прогноза» подразумевает, что именно то, насколько прогноз отклоняется от фактического, то есть прогноз-факт.
источник
Ответ @Aksakal полностью правильный, но я просто добавлю еще один элемент, который, как мне кажется, поможет мне (и моим ученикам).
Девиз: статистика "идеальна". Например, я всегда могу дать идеальный прогноз (я знаю, что некоторые брови поднимаются прямо сейчас ... так что выслушайте меня).
источник
Но если , то мы получим наши остатки с помощью , где является матрицей идемпотентной проектировании в пространство , ортогонального пространство столбцов матрицы . Если вместо этого мы использовали , то мы в конечном итоге с . Но само по себе не является идемпотентом, поскольку . Так что на самом деле является негативом матрицы проекции, а именно . Так что я рассматриваю это как отмену негатива, введенного с помощью , поэтому ради экономии лучше просто использоватьε^=Y−Y^ (I−PX)Y I−PX X Y=Xβ−ε ε^=(PX−I)Y PX−I Р Х - Я Я - Р Х У = Х β - ε Y = X β + ε Y - Y(PX−I)2=P2X−2PX+I=−(PX−I) PX−I I−PX Y=Xβ−ε Y=Xβ+ε что в свою очередь дает нам в качестве остатков.Y−Y^
Как уже упоминалось в других местах это не как - нибудь ломается , если мы используем , но мы в конечном итоге с этой двойной негативной ситуации, я думаю , что это достаточно хорошая причина , чтобы просто использовать .Y - YY^−Y Y−Y^
источник