До сих пор работая в основном с данными поперечного сечения и совсем недавно просматривая, сканируя спотыкаясь через кучу вводной литературы по временным рядам, мне интересно, какую роль играют объясняющие переменные в анализе временных рядов.
Я хотел бы объяснить тенденцию, а не ослаблять тренд. Большая часть того, что я читаю в качестве введения, предполагает, что ряд вытекает из некоторого случайного процесса. Я читал о процессах AR (p) и MA, а также о моделировании ARIMA. Желая иметь дело с большим количеством информации, чем только с авторегрессионными процессами, я нашел VAR / VECM и привел несколько примеров, но все же мне интересно, есть ли какой-то случай, связанный с тем, что пояснения делают в сечениях.
Мотивация этого заключается в том, что декомпозиция моих серий показывает, что основной вклад вносит тренд, а остаток и сезонный эффект вряд ли играют роль. Я хотел бы объяснить эту тенденцию.
Могу ли я регрессировать сериал на несколько разных серий? Интуитивно я хотел бы использовать gls из-за последовательной корреляции (я не очень уверен насчет структуры cor). Я слышал о ложной регрессии и понимаю, что это ловушка, тем не менее, я ищу способ объяснить тенденцию.
Это совершенно неправильно или необычно? Или я только что пропустил нужную главу?
источник
Та же интуиция, что и в регрессии поперечного сечения, может быть использована в регрессии временных рядов. Совершенно верно попытаться объяснить тенденцию, используя другие переменные. Основное отличие состоит в том, что неявно предполагается, что регрессоры являются случайными величинами. Итак, в регрессионной модели:
Практическая часть регрессии остается прежней, применяются все обычные статистические данные и методы.
Основной оговоркой регрессии временного ряда является то, что он может массово потерпеть неудачу, когда регрессоры не являются стационарными. Тогда обычные методы регрессии могут показать, что тенденция объясняется, а на самом деле это не так. Поэтому, если вы хотите объяснить тенденцию, вы должны проверить нестационарность, прежде чем продолжить. В противном случае вы можете прийти к ложным выводам.
источник
Если у вас есть поддерживающая / причинно-следственная / помогающая / правая / экзогенная / предикторная серия, предпочтительным подходом является построение единого уравнения, передаточной функции с несколькими входами. Необходимо изучить возможные остатки модели как для неопределенных / пропущенных детерминированных входных данных, т. Е. Сделать «Обнаружение интервенций», а также для журнала Ruey Tsay 1988 г. по прогнозированию, и неопределенных стохастических входных данных через компонент ARIMA. Таким образом, вы можете явно включить не только предложенные пользователем причины (и любые необходимые лаги!), Но и два вида пропущенных структур (макеты и ARIMA).
Следует позаботиться о том, чтобы параметры окончательной модели не изменялись значительно с течением времени, в противном случае сегментация данных могла бы быть в порядке и чтобы не было доказано, что остатки из окончательной модели имеют гетерогенную дисперсию.
Тенденция в исходной серии может быть связана с тенденциями в серии предикторов или из-за динамики авторегрессии в интересующей серии, или, возможно, из-за пропущенного детерминированного ряда, проксифицированного константой устойчивого состояния, или даже одной или несколькими тенденциями местного времени.
источник
Как менее техническая точка зрения, часто бывает не очень полезно просто объяснить тенденцию; то есть рассматривать время как предсказатель первостепенного интереса. Изменения ряда во времени часто подразумевают влияние других переменных, включая авторегрессионные и / или экзогенные процессы, которые более концептуально актуальны для исследования. Отсюда следует, что если эти переменные также меняются во времени, то фактически необходимо контролировать влияние времени, чтобы не попасть в искусственно значимые отношения, как показало @mpiktas.
источник