Некоторые предостережения, прежде чем продолжить. Как я часто предлагаю своим студентам, используйте auto.arima()
вещи только в качестве первого приближения к вашему окончательному результату или если вы хотите иметь скупую модель, когда вы проверяете, что ваша модель, основанная на теории соперника, работает лучше.
Данные
Вы должны четко начать с описания данных временных рядов, с которыми вы работаете. В макроэкономике вы обычно работаете с агрегированными данными, а геометрические средства (что удивительно) имеют более эмпирические данные для данных временных рядов макросов, вероятно потому, что большинство из них разлагаются в экспоненциально растущую тенденцию .
Кстати, предложение Роба «визуально» работает для временных рядов с четкой сезонной частью , поскольку медленно меняющиеся годовые данные менее очевидны для увеличения вариаций. К счастью, обычно наблюдается экспоненциально растущая тенденция (если она кажется линейной, то нет необходимости в бревнах).
модель
Y(t)=Xα11(t)...Xαkk(t)ε(t)
В финансовой эконометрике журналы являются обычным делом из-за популярности журнальных возвратов, потому что ...
Преобразования журнала имеют хорошие свойства
αiY( т )Икся( т )
В моделях с исправлением ошибок у нас есть эмпирически более сильное предположение, что пропорции более стабильны ( стационарны ), чем абсолютные различия.
В экономической эконометрике легко агрегировать данные о доходах по времени .
Есть много других причин, не упомянутых здесь.
в заключение
Обратите внимание, что log-преобразование обычно применяется к неотрицательным (уровням) переменным. Если вы наблюдаете различия между двумя временными рядами (например, чистый экспорт), то невозможно даже взять журнал, вам придется либо искать исходные данные по уровням, либо принимать форму общей тенденции, которая была вычтена.
[ добавление после редактирования ] Если вам все еще нужен статистический критерий того, когда выполнять преобразование журнала, простым решением будет любой тест на гетероскедастичность. В случае увеличения дисперсии я бы порекомендовал тест Гольдфельда-Квандта или аналогичный ему. В R он находится в library(lmtest)
и обозначается gqtest(y~1)
функцией. Просто регресс в терминах перехвата, если у вас нет регрессионной модели, y
это ваша зависимая переменная.
Постройте график данных в зависимости от времени. Если похоже, что вариация увеличивается с уровнем серии, возьмите журналы. В противном случае смоделируйте исходные данные.
источник
По плодам их узнаете
Предположение (подлежащее проверке) состоит в том, что ошибки модели имеют постоянную дисперсию. Обратите внимание, что это не означает ошибки предполагаемой модели. Когда вы используете простой графический анализ, вы по существу предполагаете линейную модель во времени.
Таким образом, если у вас есть неадекватная модель, такая, которая может быть предложена случайным графиком данных в зависимости от времени, вы можете ошибочно сделать вывод о необходимости силового преобразования. Бокс и Дженкинс сделали это с их примером данных авиакомпании. Они не учитывают 3 необычных значения в самых последних данных, таким образом, они неверно пришли к выводу, что на самом высоком уровне ряда были большие отклонения в остатках.
Для получения дополнительной информации по этому вопросу см. Http://www.autobox.com/pdfs/vegas_ibf_09a.pdf.
источник
Возможно, вы захотите логарифмировать ряды, когда они имеют естественную геометрическую форму или когда временная стоимость инвестиций подразумевает, что вы будете сравнивать с облигацией с минимальным риском, которая имеет положительный доход. Это сделает их более «линеаризуемыми» и, следовательно, пригодными для простого разностного отношения повторения.
источник