Есть ли золотой стандарт для моделирования нерегулярно расположенных временных рядов?

45

В области экономики (я думаю) у нас есть ARIMA и GARCH для регулярно разнесенных временных рядов и Пуассон, Хоукс для моделирования точечных процессов, так как насчет попыток моделирования нерегулярно (неравномерно) разнесенных временных рядов - есть (по крайней мере) какие-либо общие практики ?

(Если у вас есть знания в этой теме, вы также можете расширить соответствующую статью вики .)

Редакция (о пропущенных значениях и нерегулярных временных рядах):

Ответ на комментарий @Lucas Reis. Если промежутки между измерениями или переменными реализаций разнесены из-за (например) процесса Пуассона, для такого рода регуляризации не так много места, но существует простая процедура: t(i)это i-й индекс времени переменной x (i-й момент времени реализации x), затем определяем промежутки между временами измерений как g(i)=t(i)-t(i-1), затем мы дискретизируем, g(i)используя константу c, dg(i)=floor(g(i)/cи создаем новый временной ряд с числом пустых значений между старыми наблюдениями из исходного временного ряда iи i+1равным dg (i), но проблема в том, что это Процедура может легко получить временные ряды с количеством пропущенных данных, намного превышающим количество наблюдений, поэтому разумная оценка значений отсутствующих наблюдений может быть невозможной и слишком большойcудалить "временную структуру / временную зависимость и т. д." анализируемой проблемы (крайний случай задается тем, c>=max(floor(g(i)/c))что просто сворачивают нерегулярно разнесенные временные ряды в регулярно разнесенные

Edition2 (просто для удовольствия): изображение учитывает пропущенные значения в нерегулярно расположенных временных рядах или даже в случае точечного процесса.

Qbik
источник
Просто чтобы уточнить, когда вы говорите «нерегулярно с интервалом», вы не имеете в виду «с регулярным интервалом, но с пропущенными значениями», верно?
Уэйн
2
Нет :) t(i)- время x[t(i)],x[t(i+1)],x[t(i+2)]...и t(j+1)-t(j)не постоянно. Данные собираются в распределенном или асинхронном имении.
Qbik
2
Как насчет интерполяции и выполнения анализа с интерполированными значениями, расположенными на регулярной основе? Кто-нибудь знает, каковы будут последствия этого метода?
Лукас Рейс
Как насчет сначала моделирования времен точек, а затем значений точек, зависящих от их времени? Я считаю, что «отмеченные точечные процессы» - это термин.
PeterR

Ответы:

26

Если наблюдения случайного процесса расположены нерегулярно, наиболее естественным способом моделирования наблюдений является наблюдение с дискретным временем из непрерывного процесса времени.

X1,,Xnt1<t2<<tnXiXi1,,X1Xi1 Xi2,,X1 titi1titi1

titi1=1P1Ptiti1Pt

dXt=a(Xt)dt+b(Xt)dBt.
Стефано Якус. Может быть так, что для эквидистантных наблюдений описано много методов и результатов, но обычно это просто удобно для представления и не существенно для приложения. Одним из основных препятствий является то, что спецификация SDE редко допускает явную вероятность, когда у вас есть дискретные наблюдения, но есть хорошо разработанные альтернативы уравнения оценки.

dXt=0ta(s)(XtXs)ds+σdBt
(p)

Я думаю, что было бы справедливо сказать, что общепринятой практикой при наблюдениях в нерегулярные моменты времени является построение стохастической модели с непрерывным временем.

NRH
источник
1
GARCH - это не случайный процесс волатильности. Объем в GARCH полностью определяется для этого периода наблюдениями в предыдущих периодах.
Аксакал
12

Для нерегулярных временных рядов легко построить фильтр Калмана .

Существует документ , как передать ARIMA в пространстве состояний здесь

(1)

(1)

bdecaf
источник
Извините, у меня нет доступа к этой последней статье, не могли бы вы мне помочь?
Кварц
2
Я добавил цитату, чтобы ее было легко найти - здесь также есть препринт: eprints.soton.ac.uk/147383
bdecaf
Бумага о переносе ARIMA в пространство состояний, похоже, содержит неработающую ссылку.
ofey73
9

Когда я искал способ измерить количество флуктуаций в данных с нерегулярной выборкой, я наткнулся на эти две работы по экспоненциальному сглаживанию нерегулярных данных от Cipra [ 1 , 2 ]. Они основаны далее на методах сглаживания Брауна, Уинтерса и Холта (см. Статью Википедии об экспоненциальном сглаживании ) и на другом методе Райта (см. Статью для ссылок). Эти методы не предполагают многого о базовом процессе, а также работают с данными, показывающими сезонные колебания.

Я не знаю, считается ли это «золотым стандартом». Для своих собственных целей я решил использовать двухстороннее (одиночное) экспоненциальное сглаживание по методу Брауна. У меня появилась идея двухстороннего сглаживания чтения резюме в студенческую газету (которую я сейчас не могу найти).

Ivana
источник
7

Анализ нерегулярно выбранных временных рядов может быть сложным, так как не так много доступных инструментов. Иногда практикой является применение регулярных алгоритмов и надежда на лучшее. Это не обязательно лучший подход. В других случаях люди пытаются интерполировать данные в промежутках. Я даже видел случаи, когда пробелы заполнялись случайными числами, которые имеют такое же распределение, что и известные данные. Одним из алгоритмов, специально предназначенных для рядов с нерегулярной выборкой, является периодограмма Ломба-Скаргла, которая дает периодограмму (спектр мощности) для неравномерно выбранных временных рядов. Lomb-Scargle не требует никакого «кондиционирования промежутка».

cwkulp
источник
3

Если вам нужна «локальная» модель во временной области (в отличие от оценки корреляционных функций или спектров мощности), скажем, для обнаружения и характеристики переходных импульсов, скачков и т. Д., То алгоритм Байесовского блока может быть полезен. Он обеспечивает оптимальное кусочно-постоянное представление временных рядов в любом режиме данных и с произвольной (неравномерно) разнесенной выборкой. Видеть

«Исследования по астрономическому анализу временных рядов. VI. Байесовские блочные представления», Scargle, Jeffrey D .; Норрис, Джей П .; Джексон, Брэд; Chiang, James, Astrophysical Journal, Volume 764, 167, 26 pp. (2013). http://arxiv.org/abs/1207.5578

Джефф Скаргл
источник
2

RJMartin, "Нерегулярные дискретизированные сигналы: теории и методы анализа", кандидатская диссертация, UCL, 1998, доступна онлайн. Глава 4 посвящена авторегрессионным моделям и развивает предмет с точки зрения непрерывного времени, как отмечалось в других постах.

Ричард Мартин
источник
1

Раздел 4.10 Дж. Дурбина, С.Дж.Купмана, Анализ временных рядов с помощью методов пространства состояний , 2-е издание, 2012 г., посвящен моделированию в случае отсутствия наблюдений.

Ян Галковски
источник
1

В анализе пространственных данных данные в большинстве случаев выбираются нерегулярно в пространстве. Поэтому одной идеей будет посмотреть, что там делается, и реализовать оценку вариограммы, кригинг и т. Д. Для одномерной области «времени». Вариограммы могут быть интересны даже для регулярно разнесенных данных временного ряда, поскольку они имеют отличные свойства от функции автокорреляции, а также являются определенными и значимыми даже для нестационарных данных.

Вот одна статья (на испанском), а здесь другая.

Къетил б Халворсен
источник