Недавно я узнал об использовании методов начальной загрузки для расчета стандартных ошибок и доверительных интервалов для оценок. Я узнал, что если данные являются IID, вы можете обрабатывать данные выборки как совокупность и выполнять выборку с заменой, и это позволит вам получить несколько результатов моделирования статистики теста.
В случае временных рядов вы явно не можете сделать это, потому что автокорреляция, вероятно, существует. У меня есть временной ряд, и я хотел бы рассчитать среднее значение данных до и после фиксированной даты. Есть ли правильный способ сделать это, используя модифицированную версию начальной загрузки?
time-series
bootstrap
statnub
источник
источник
Ответы:
Как указывает @cardinal, вариации «блочной загрузки» - это естественный подход. Здесь, в зависимости от метода, вы выбираете отрезки временного ряда, либо перекрывающиеся, либо нет, и фиксированной длины или случайные, что может гарантировать стационарность в выборках ( Politis и Romano, 1991 ), а затем соединяете их вместе, чтобы создать пересчитанные временные ряды. на котором вы вычисляете свою статистику. Также можно попытаться построить модели временных зависимостей, приводящих к методам Маркова, авторегрессионным ситам и другим. Но блочная загрузка - это, пожалуй, самый простой из этих методов.
Gonçalves and Politis (2011) - очень короткий обзор со ссылками. Книжное лечение - Lahiri (2010) .
источник
tsboot
вboot
пакете в R для этого.Модульная повторная выборка легко адаптируется к временным рядам. Повторные выборки получают путем моделирования модели временных рядов. Например, если модель ARIMA (p, d, q), то повторные выборки модели ARIMA (p, q) с MLE (из разностного ряда) коэффициентов авторегрессии и скользящего среднего и дисперсией шума. Повторными выборками являются последовательности частичной суммы моделируемого процесса ARIMA (p, q).
Бесмодельная повторная выборка временных рядов осуществляется путем повторной выборки блоков, также называемой блочной начальной загрузкой, которая может быть реализована с использованием функции tsboot в загрузочном пакете R. Идея состоит в том, чтобы разбить ряд на примерно равные по длине блоки последовательных наблюдений, повторно сэмплировать блок с заменой, а затем вставить блоки вместе. Например, если временной ряд имеет длину 200, а один использует 10 блоков длиной 20, то блоками являются первые 20 наблюдений, следующие 20 и т. Д. Возможной повторной выборкой является четвертый блок (наблюдение от 61 до 80), затем последний блок (наблюдение от 181 до 200), затем второй блок (наблюдение от 21 до 40), затем снова четвертый блок и так далее, пока не будет 10 блоков в повторной выборке.
источник