В области экономики (я думаю) у нас есть ARIMA и GARCH для регулярно разнесенных временных рядов и Пуассон, Хоукс для моделирования точечных процессов, так как насчет попыток моделирования нерегулярно (неравномерно) разнесенных временных рядов - есть (по крайней мере) какие-либо общие практики ?
(Если у вас есть знания в этой теме, вы также можете расширить соответствующую статью вики .)
Редакция (о пропущенных значениях и нерегулярных временных рядах):
Ответ на комментарий @Lucas Reis. Если промежутки между измерениями или переменными реализаций разнесены из-за (например) процесса Пуассона, для такого рода регуляризации не так много места, но существует простая процедура: t(i)
это i-й индекс времени переменной x (i-й момент времени реализации x), затем определяем промежутки между временами измерений как g(i)=t(i)-t(i-1)
, затем мы дискретизируем, g(i)
используя константу c
, dg(i)=floor(g(i)/c
и создаем новый временной ряд с числом пустых значений между старыми наблюдениями из исходного временного ряда i
и i+1
равным dg (i), но проблема в том, что это Процедура может легко получить временные ряды с количеством пропущенных данных, намного превышающим количество наблюдений, поэтому разумная оценка значений отсутствующих наблюдений может быть невозможной и слишком большойc
удалить "временную структуру / временную зависимость и т. д." анализируемой проблемы (крайний случай задается тем, c>=max(floor(g(i)/c))
что просто сворачивают нерегулярно разнесенные временные ряды в регулярно разнесенные
Edition2 (просто для удовольствия): изображение учитывает пропущенные значения в нерегулярно расположенных временных рядах или даже в случае точечного процесса.
t(i)
- времяx[t(i)],x[t(i+1)],x[t(i+2)]...
иt(j+1)-t(j)
не постоянно. Данные собираются в распределенном или асинхронном имении.Ответы:
Если наблюдения случайного процесса расположены нерегулярно, наиболее естественным способом моделирования наблюдений является наблюдение с дискретным временем из непрерывного процесса времени.
Я думаю, что было бы справедливо сказать, что общепринятой практикой при наблюдениях в нерегулярные моменты времени является построение стохастической модели с непрерывным временем.
источник
Для нерегулярных временных рядов легко построить фильтр Калмана .
Существует документ , как передать ARIMA в пространстве состояний здесь
источник
Когда я искал способ измерить количество флуктуаций в данных с нерегулярной выборкой, я наткнулся на эти две работы по экспоненциальному сглаживанию нерегулярных данных от Cipra [ 1 , 2 ]. Они основаны далее на методах сглаживания Брауна, Уинтерса и Холта (см. Статью Википедии об экспоненциальном сглаживании ) и на другом методе Райта (см. Статью для ссылок). Эти методы не предполагают многого о базовом процессе, а также работают с данными, показывающими сезонные колебания.
Я не знаю, считается ли это «золотым стандартом». Для своих собственных целей я решил использовать двухстороннее (одиночное) экспоненциальное сглаживание по методу Брауна. У меня появилась идея двухстороннего сглаживания чтения резюме в студенческую газету (которую я сейчас не могу найти).
источник
Анализ нерегулярно выбранных временных рядов может быть сложным, так как не так много доступных инструментов. Иногда практикой является применение регулярных алгоритмов и надежда на лучшее. Это не обязательно лучший подход. В других случаях люди пытаются интерполировать данные в промежутках. Я даже видел случаи, когда пробелы заполнялись случайными числами, которые имеют такое же распределение, что и известные данные. Одним из алгоритмов, специально предназначенных для рядов с нерегулярной выборкой, является периодограмма Ломба-Скаргла, которая дает периодограмму (спектр мощности) для неравномерно выбранных временных рядов. Lomb-Scargle не требует никакого «кондиционирования промежутка».
источник
Если вам нужна «локальная» модель во временной области (в отличие от оценки корреляционных функций или спектров мощности), скажем, для обнаружения и характеристики переходных импульсов, скачков и т. Д., То алгоритм Байесовского блока может быть полезен. Он обеспечивает оптимальное кусочно-постоянное представление временных рядов в любом режиме данных и с произвольной (неравномерно) разнесенной выборкой. Видеть
«Исследования по астрономическому анализу временных рядов. VI. Байесовские блочные представления», Scargle, Jeffrey D .; Норрис, Джей П .; Джексон, Брэд; Chiang, James, Astrophysical Journal, Volume 764, 167, 26 pp. (2013). http://arxiv.org/abs/1207.5578
источник
RJMartin, "Нерегулярные дискретизированные сигналы: теории и методы анализа", кандидатская диссертация, UCL, 1998, доступна онлайн. Глава 4 посвящена авторегрессионным моделям и развивает предмет с точки зрения непрерывного времени, как отмечалось в других постах.
источник
Раздел 4.10 Дж. Дурбина, С.Дж.Купмана, Анализ временных рядов с помощью методов пространства состояний , 2-е издание, 2012 г., посвящен моделированию в случае отсутствия наблюдений.
источник
В анализе пространственных данных данные в большинстве случаев выбираются нерегулярно в пространстве. Поэтому одной идеей будет посмотреть, что там делается, и реализовать оценку вариограммы, кригинг и т. Д. Для одномерной области «времени». Вариограммы могут быть интересны даже для регулярно разнесенных данных временного ряда, поскольку они имеют отличные свойства от функции автокорреляции, а также являются определенными и значимыми даже для нестационарных данных.
Вот одна статья (на испанском), а здесь другая.
источник