Я понимаю, что стационарный временной ряд - это тот, чье среднее значение и дисперсия постоянны во времени. Может кто-нибудь объяснить, почему мы должны убедиться, что наш набор данных является стационарным, прежде чем мы сможем запустить на нем различные модели ARIMA или ARM? Относится ли это также к нормальным регрессионным моделям, где автокорреляция и / или время не имеют значения?
92
Ответы:
Стационарность - это один тип структуры зависимости.
Предположим , у нас есть данные . Самое основное предположение состоит в том, что X i независимы, т.е. у нас есть выборка. Независимость - хорошее свойство, так как с ее помощью мы можем получить много полезных результатов. Проблема в том, что иногда (или часто, в зависимости от вида) это свойство не сохраняется.Икс1, . , , , XN Икся
Теперь независимость является уникальным свойством, две случайные переменные могут быть независимыми только одним способом, но они могут зависеть по-разному. Таким образом, стационарность является одним из способов моделирования структуры зависимости. Оказывается, что много хороших результатов, которые справедливы для независимых случайных величин (закон больших чисел, центральная предельная теорема и многие другие), справедливы для стационарных случайных величин (мы должны строго сказать последовательности). И, конечно же, оказывается, что многие данные можно считать стационарными, поэтому концепция стационарности очень важна при моделировании независимых данных.
Когда мы определили, что у нас есть стационарность, естественно, мы хотим смоделировать ее. Именно здесь приходят модели ARMA. Оказывается, что любые стационарные данные могут быть аппроксимированы стационарной моделью ARMA благодаря теореме разложения Вольда . Вот почему модели ARMA очень популярны, и поэтому мы должны убедиться, что серия является стационарной для использования этих моделей.
Теперь опять та же история, что и с независимостью и зависимостью. Стационарность определяется однозначно, т. Е. Данные являются либо стационарными, либо нет, поэтому существует только один способ, чтобы данные были стационарными, но существует множество способов нестационарности данных. Снова оказывается, что много данных становится постоянным после определенного преобразования. Модель ARIMA - это одна модель нестационарности. Предполагается, что данные становятся постоянными после различий.
В контексте регрессии важна стационарность, поскольку те же результаты, которые применяются к независимым данным, сохраняются, если данные являются стационарными.
источник
Какие величины нас обычно интересуют, когда мы выполняем статистический анализ временных рядов? Мы хотим знать
Как мы рассчитываем эти вещи? Использование среднего значения за многие периоды времени.
Среднее значение для многих периодов времени является информативным, только если ожидаемое значение является одинаковым для этих периодов времени. Если эти параметры популяции могут варьироваться, что мы на самом деле оцениваем, принимая среднее значение по времени?
(Слабая) стационарность требует, чтобы эти величины популяции были одинаковыми во времени, что делает выборочный средний показатель разумным способом их оценки.
В дополнение к этому, стационарные процессы позволяют избежать проблемы ложной регрессии .
источник
Основная идея статистического обучения заключается в том, что вы можете учиться, повторяя эксперимент. Например, мы можем продолжать щелкать чертёжной кнопкой, чтобы узнать вероятность того, что чертёжная кнопка приземлится на его голову.
В контексте временных рядов мы наблюдаем один прогон случайного процесса, а не повторные прогоны случайного процесса. Мы наблюдаем 1 длинный эксперимент, а не несколько независимых экспериментов.
Нам нужны стационарность и эргодичность, чтобы наблюдение стохастического процесса в долгосрочной перспективе было аналогично наблюдению многих независимых течений стохастического процесса.
Некоторые (неточные) определения
Основная проблема во временных рядах
Чтобы несколько наблюдений с течением времени выполняли аналогичную задачу, как многократные извлечения из выборочного пространства , нам нужны стационарность и эргодичность .
Пример 1: сбой стационарности
Пример: сбой эргодичности
источник
Чтобы добавить высокоуровневый ответ к некоторым другим ответам, которые являются хорошими, но более подробными, важна стационарность, поскольку при ее отсутствии модель, описывающая данные, будет различаться по точности в разные моменты времени. По существу, стационарность требуется для выборочных статистических данных, таких как средние значения, дисперсии и корреляции, для точного описания данных во всех интересующих моментах времени.
источник
Тем не менее, мы часто ищем стационарность. Почему?
Рассмотрим проблему прогнозирования. Как вы прогнозируете? Если завтра все будет иначе, то невозможно предсказать, потому что все будет иначе. Таким образом, ключ к прогнозированию - найти то, что будет таким же завтра, и перенести это на завтра. Это что-то может быть чем угодно. Я приведу пару примеров.
Для прогнозирования нам абсолютно необходимо найти постоянную (временную) составляющую в ряду, иначе невозможно сделать прогноз по определению. Стационарность - это частный случай инвариантности.
источник
Поскольку ARIMA по большей части регрессирует сама по себе, она использует тип самоиндуцированной множественной регрессии, на которую неоправданно влияет либо сильная тенденция, либо сезонность. Этот метод множественной регрессии основан на предыдущих значениях временных рядов, особенно в последних периодах, и позволяет нам извлечь очень интересную «взаимосвязь» между несколькими прошлыми значениями, которая работает для объяснения будущей ценности.
источник
Идея стационарности модели ARMA тесно связана с идеей обратимости.
источник
ARMA и ARIMA построены с предположением, что серия является стационарной. Если серии нет, то прогноз будет неверным.
Выборочная статистика - среднее значение, дисперсия, ко-дисперсия - полезна в качестве дескрипторов будущего поведения, только если ряд является стационарным. Например, если ряд последовательно увеличивается с течением времени, среднее значение выборки и дисперсия будут расти вместе с размером выборки, и они всегда будут недооценивать среднее значение и дисперсию в будущих периодах. Важно быть осторожным при попытке экстраполировать регрессионные модели, приспособленные к нестационарным данным.
источник
На мой взгляд, стохастический процесс - это процесс, который определяется тремя статистическими свойствами, которые должны быть неизменными во времени. Это средняя дисперсия и функция автокорреляции. Хотя первые два ничего не говорят об эволюции процесса во времени, поэтому следует учитывать третье свойство - автокорреляционную функцию, которая говорит о том, как зависимость затухает с течением времени (лаг).
источник
Чтобы решить что-либо, нам нужно математически смоделировать уравнения с использованием статики.
В процессе конвертации мы получим тренд и сезонность
источник