Какое отношение имеет ARMA / ARIMA к моделированию смешанных эффектов?

14

При анализе панельных данных я использовал многоуровневые модели со случайными / смешанными эффектами для решения проблем автокорреляции (т. Е. Наблюдения сгруппированы внутри отдельных лиц во времени) с другими параметрами, добавленными для корректировки некоторой спецификации времени и шоков интереса. , ARMA / ARIMA, похоже, предназначены для решения подобных проблем.

Ресурсы, которые я нашел в Интернете, обсуждают либо временные ряды (ARMA / ARIMA), либо модели смешанных эффектов, но помимо того, что они основаны на регрессии, я не понимаю взаимосвязи между ними. Можно ли использовать ARMA / ARIMA из многоуровневой модели? Есть ли смысл в том, что эти два эквивалента или избыточны?

Ответы или ссылки на ресурсы, которые обсуждают это, было бы замечательно.

Бенджамин Мако Хилл
источник

Ответы:

11

Я думаю, что самый простой способ взглянуть на это состоит в том, чтобы заметить, что ARMA и подобные модели предназначены для того, чтобы делать разные вещи, чем многоуровневые модели, и использовать разные данные.

Анализ временных рядов обычно имеет длинные временные ряды (возможно, сотни или даже тысячи временных точек), и основная цель состоит в том, чтобы посмотреть, как меняется одна переменная во времени. Существуют сложные методы решения многих проблем - не только автокорреляции, но и сезонности, других периодических изменений и так далее.

Многоуровневые модели являются продолжением регрессии. Обычно у них относительно мало временных точек (хотя их может быть много), и основная цель - изучить взаимосвязь между зависимой переменной и несколькими независимыми переменными. Эти модели не так хорошо справляются со сложными отношениями между переменной и временем, отчасти потому, что они обычно имеют меньше временных точек (сложно взглянуть на сезонность, если у вас нет нескольких данных для каждого сезона).

Питер Флом - Восстановить Монику
источник
1
: Питер Очень хорошее резюме. Я бы только добавил, что данные временных рядов обычно не являются «длинными» при работе с еженедельными / ежемесячными / годовыми данными, НО могут быть длинными при работе с ежедневными / почасовыми / вторыми данными.
IrishStat
3
Ваше объяснение довольно хорошее на практике, хотя я бы добавил небольшое предостережение. Модели ARIMA могут быть реализованы как модели State Space (R arimaделает это под капотом), также известные как динамические линейные модели (DLM). DLM также являются расширениями регрессии (иным образом, чем Смешанные эффекты), поэтому я предполагаю, что между ARIMA и моделями со смешанными эффектами существует глубокая связь. Это не меняет различий на практике , которые вы хорошо суммируете.
Уэйн
1
T-1
Бенджамин: Вся идея статистики состоит в том, чтобы идентифицировать структуру, а не предполагать ее.
IrishStat
Я думаю, что полный ответ мог бы также упомянуть разницу между временными рядами и данными панели. Если я правильно понимаю, ARIMA и аналогичные в основном используются для данных, где каждое наблюдение имеет одну и ту же переменную во времени. В многоуровневой модели изменений мы обычно ориентируемся на групповые данные и моделируем переменную, измеряемую в течение определенного времени для отдельных лиц, групп, стран и т. Д. Правильно?
Бенджамин Мако Хилл
7

ARMA / ARIMA - это одномерные модели, которые оптимизируют использование прошлого одной серии для прогнозирования этой отдельной серии. Можно дополнить эти модели эмпирически определенными переменными вмешательства, такими как импульсы, сдвиги уровней, сезонные импульсы и тренды местного времени, НО они по-прежнему принципиально не являются причинно-следственными связями, так как нет никаких вводимых пользователем серий ввода. Многовариантное расширение этих моделей называется XARMAX или, в более общем смысле, моделями передаточных функций, которые используют структуры PDL / ADL на входах и используют любую необходимую структуру ARMA / ARIMA в оставшейся части. Эти модели также могут быть обоснованы путем включения эмпирически идентифицируемых детерминированных входных данных. Таким образом, обе эти модели можно считать приложениями к продольным (повторным измерениям) данным. Теперь статья в Википедии о многоуровневых моделях относится к их применению к временным рядам / продольным данным, предполагая определенные примитивные / тривиальные, то есть неаналитические структуры, такие как «В простейших моделях предполагается, что влияние времени является линейным. Можно задавать полиномиальные модели для учета квадратичных или кубических эффектов времени» ,

Можно расширить модель передаточной функции, чтобы охватить несколько групп, и, таким образом, перейти к анализу временных рядов по объединенному сечению, где соответствующая структура (лаги / отведения) может использоваться вместе со структурой ARIMA для формирования как локальных моделей, так и общей модели.

IrishStat
источник
Многоуровневые модели могут также использовать общую спецификацию для времени, которая добавляет манекены для каждого времени, которые будут фиксировать средний эффект за этот период времени.
Бенджамин Мако Хилл
1
Benjamin Проблема с тем, что вы предполагаете, что сезонность является детерминированной, и, в завершение, сезонные коэффициенты инвариантны во времени по сравнению с сезонным импульсом одного из манекенов ISI-1, который не имел эффекта в первый k раз. периоды, но сделал это после. Другая, в равной степени возможная сезонная структура - это сезонный компонент ARIMA, который использует адаптивный ответ на предыдущие сезоны по сравнению с вашим предложенным фиксированным ответом.
IrishStat