Учитывая все хорошие свойства моделей пространства состояний и KF, я задаюсь вопросом - каковы недостатки моделирования пространства состояний и использования фильтра Калмана (или EKF, UKF или фильтра частиц) для оценки? Допустим, скажем, обычные методологии, такие как ARIMA, VAR или специальные / эвристические методы.
Их сложно откалибровать? Они сложны и трудно понять, как изменение структуры модели повлияет на прогнозы?
Или, другими словами, каковы преимущества обычных ARIMA, VAR по сравнению с моделями в пространстве состояний?
Я могу думать только о преимуществах модели пространства состояний:
- Он легко обрабатывает структурные разрывы, сдвиги, изменяющиеся во времени параметры некоторой статической модели - просто делайте эти параметры динамическими состояниями модели пространства состояний, и модель автоматически адаптируется к любым изменениям параметров;
- Он обрабатывает недостающие данные очень естественно, просто сделайте шаг перехода KF и не делайте шаг обновления;
- Он позволяет оперативно изменять параметры самой модели пространства состояний (ковариации шумов и матриц перехода / наблюдения), поэтому, если ваше текущее наблюдение получено из источника, немного отличающегося от других, вы можете легко включить его в оценку, не делая что-нибудь особенное;
- Использование вышеуказанных свойств позволяет легко обрабатывать данные с нерегулярным интервалом: либо изменять модель каждый раз в соответствии с интервалом между наблюдениями, либо использовать регулярный интервал и обрабатывать интервалы без наблюдений как отсутствующие данные;
- Это позволяет использовать данные из разных источников одновременно в одной и той же модели для оценки одной базовой величины;
- Это позволяет построить модель из нескольких интерпретируемых ненаблюдаемых динамических компонентов и оценить их;
- Любая модель ARIMA может быть представлена в форме пространства состояний, но только простые модели пространства состояний могут быть представлены точно в форме ARIMA.
time-series
arima
kalman-filter
var
Kochede
источник
источник
Ответы:
Вот предварительный список недостатков, которые я смог извлечь из ваших комментариев. Критика и дополнения очень приветствуются!
В целом - по сравнению с ARIMA, модели пространства состояний позволяют моделировать более сложные процессы, иметь интерпретируемую структуру и легко обрабатывать неточности данных; но за это вы платите повышенной сложностью модели, более сложной калибровкой, меньшими знаниями сообщества.
источник
Спасибо @IrishStat за несколько очень хороших вопросов в комментариях, ответ на ваши вопросы слишком длинный, чтобы публиковать его в качестве комментария, поэтому я публикую его как ответ (к сожалению, не на оригинальный вопрос темы).
Были заданы следующие вопросы: « Четко ли он определяет изменения временного тренда и сообщает о моментах времени, когда меняется тренд? Различает ли он изменения параметров и дисперсии ошибок, и сообщает ли об этом? заданные предикторы? Можно ли указать минимальное количество значений в группе до того, как будет объявлен сдвиг уровня / тренд местного времени? Различает ли она необходимость в преобразованиях мощности по сравнению с детерминированными моментами времени, когда изменяется дисперсия ошибки? "
источник
Фильтр Калмана является оптимальной линейной квадратичной оценкой, когда динамика состояния и ошибки измерения соответствуют так называемым линейным гауссовским предположениям ( http://wp.me/p491t5-PS ). Итак, если вы знаете свои динамические и измерительные модели и они следуют линейным гауссовским предположениям, лучшего оценки в классе линейных квадратичных оценок нет. Однако наиболее распространенными причинами «неудачных» приложений Kalman Filter являются:
Неточное / неправильное знание динамики состояния и моделей измерения.
Неточная инициализация фильтра (предоставление оценки начального состояния и ковариации, которая не соответствует истинному состоянию системы). Это легко преодолеть с помощью процедуры инициализации Взвешенных наименьших квадратов (WLS).
Включение измерений, которые являются статистическими "выбросами" по отношению к модели системной динамики. Это может привести к тому, что коэффициент усиления Калмана будет иметь отрицательные элементы, что может привести к неположительной полуопределенной ковариационной матрице после обновления. Этого можно избежать, используя алгоритмы «стробирования», такие как эллипсоидальное стробирование, для проверки правильности измерения перед обновлением фильтра Калмана этим измерением.
Вот некоторые из наиболее распространенных ошибок / проблем, с которыми я сталкивался при работе с фильтром Калмана. В противном случае, если предположения ваших моделей верны, фильтр Калмана является оптимальной оценкой.
источник
Вы можете обратиться к превосходной книге Байесовского прогнозирования и динамических моделей (Harrison and West, 1997). Авторы показывают, что почти все традиционные модели временных рядов являются частными случаями общей динамической модели. Они также подчеркивают преимущества. Возможно, одним из основных преимуществ является легкость, с которой вы можете интегрировать многие модели пространства состояний, просто увеличивая вектор состояния. Например, вы можете легко интегрировать регрессоры, сезонные факторы и авторегрессионный компонент в одну модель.
источник
Я бы добавил, что если вы напрямую используете функцию State Space, вам, вероятно, придется понимать несколько матриц, составляющих модель, и как они взаимодействуют и работают. Это больше похоже на определение программы, чем на определение модели ARIMA. Если вы работаете с динамической моделью State Space, она становится еще более сложной.
Если вы используете программный пакет, который имеет действительно очень хорошую функцию State Space, вы, возможно, сможете этого избежать, но подавляющее большинство таких функций в R-пакетах требуют, чтобы вы в какой-то момент переходили к деталям.
На мой взгляд, это во многом похоже на байесовскую статистику, механизм которой требует большего понимания, заботы и питания, чем более частые функции.
В обоих случаях это стоит дополнительных подробностей / знаний, но это может стать препятствием для принятия.
источник