В чем проблема использования R-квадрата в моделях временных рядов?

12

Я читал, что использование R-квадрата для временных рядов не подходит, потому что в контексте временных рядов (я знаю, что существуют другие контексты) R-квадрат больше не уникален. Почему это? Я пытался найти это, но я ничего не нашел. Обычно я не придаю особого значения R-квадрату (или скорректированному R-квадрату), когда оцениваю свои модели, но многие мои коллеги (например, бизнес-мажоры) абсолютно влюблены в R-квадрат и я хочу иметь возможность объясните им, почему R-Squared не подходит в контексте временных рядов.

мммммммммм
источник
3
Поиск в Google: «ложная регрессия в эконометрике». Или посмотрите статью Грейнджер и Ньюболд . Другие могут предоставить более подробную информацию в ответах.
Грэм Уолш
@Richard Hardy, не могли бы вы пояснить: «Если мы возьмем выборку R2 в качестве показателя ее популяции, она разбивается на интегрированные временные ряды».
Сиддхарт Кришнамурти

Ответы:

18

Некоторые аспекты проблемы:

Если кто-то дает нам вектор чисел и согласованную матрицу чисел X , нам не нужно знать, каково отношение между ними, чтобы выполнить некоторую алгебру оценки, рассматривая y как зависимую переменную. Алгебра будет возникать независимо от того, представляют ли эти числа данные поперечного сечения, временные ряды или данные панели, или содержит ли матрица X запаздывающие значения y и т. Д. YИксYИксY

Фундаментальным определением коэффициента детерминации являетсяр2

р2знак равно1-SSреsSSTоT

где - сумма квадратов невязок из некоторой процедуры оценки, а S S t o t - сумма квадратов отклонений зависимой переменной от ее выборочного среднего.SSреsSSTоT

При объединении всегда будет однозначно рассчитываться для конкретной выборки данных, конкретной формулировки отношения между переменными и конкретной процедуры оценки, при условии, что процедура оценки такова, что она обеспечивает точечные оценки вовлеченные неизвестные величины (и, следовательно, точечные оценки зависимой переменной и, следовательно, точечные оценки невязок). Если какой-либо из этих трех аспектов изменится, арифметическое значение R 2 в целом изменится, но это верно для любого типа данных, а не только для временных рядов.р2р2

р2р2р2

р2

р2р2бездонные предсказания вне выборки.

Интуитивно понятно, что этот, возможно, противоречащий интуитивному компромиссу, происходит потому, что, фиксируя всю изменчивость зависимой переменной в оценочном уравнении, мы превращаем несистематическую изменчивость в систематическую с точки зрения прогнозирования (здесь «бессистемный» следует понимать относительно наших знаний - с чисто детерминистской философской точки зрения не существует такой вещи, как «бессистемная изменчивость». Но в той степени, в которой наше ограниченное знание заставляет нас рассматривать некоторую изменчивость как «бессистемную», тогда попытка, тем не менее, превратить ее в систематическую компонент, приносящий предсказание катастрофы).

р2р21

Алекос Пападопулос
источник
Хорошее объяснение, но почему это добавлено в качестве стандартного вывода программного обеспечения в статистическом пакете
@brijesh Регресс-традиция, я бы сказал.
Алекос Пападопулос
р2