Корреляция между двумя временными рядами

24

Какой самый простой способ / метод для вычисления корреляции между двумя временными рядами, которые имеют одинаковый размер? Я думал о умножении и и сложении умножения. Так что, если это единственное число было положительным, можем ли мы сказать, что эти две серии взаимосвязаны? Однако я могу вспомнить некоторые примеры, когда линейно другой экспоненциально растущий временной ряд не имел бы отношения друг к другу, но приведенные выше вычисления показали бы, что они коррелированы.( y [ t ] - μ y )(Икс[T]-μИкс)(Y[T]-μY)

Есть предположения?

BBDynSys
источник
3
Вы когда-нибудь слышали о функции взаимной корреляции - en.wikipedia.org/wiki/Cross-correlation#Time_series_analysis ?
Макрос
Ваши два временных ряда точно одинакового размера. См. Stats.stackexchange.com/questions/3463/…, так как он похож, не совсем идентичен вашему вопросу, с двумя сериями одинакового размера и частоты, хотя они не являются стационарными.
Элли Кессельман

Ответы:

11

Точка макроса является правильной, правильный способ сравнения взаимосвязей между временными рядами - это функция взаимной корреляции (при условии стационарности). Наличие одинаковой длины не обязательно. Кросс-корреляция при лаге 0 просто вычисляет корреляцию, как при оценке корреляции Пирсона, объединяющей данные в идентичные моменты времени. Если они имеют ту же длину, что и вы, у вас будет точная пара T, где T - количество временных точек для каждой серии. Кросс-корреляция отставания 1 соответствует времени t из серии 1 с временем t + 1 в серии 2. Обратите внимание, что здесь, даже если серии имеют одинаковую длину, у вас есть только пара T-2, так как одна точка в первой серии не имеет соответствия во второй и еще один пункт во второй серии не будет совпадать с первой. Учитывая эти две серии, вы можете оценить взаимную корреляцию с несколькими лагами. Если какая-либо из взаимных корреляций статистически значительно отличается от 0, это будет указывать на корреляцию между двумя рядами.

Майкл Р. Черник
источник
Привет, Майкл, можно ли количественно определить «существенно отличающиеся» - могу ли я использовать стандартное отклонение 1 или 2 от нуля как существенное?
BBDynSys
@ user423805 Я изменил его, чтобы считать статистически значимо отличным от 0. Формально это означает, что вы проверяете нулевую гипотезу, что корреляция равна нулю, по сравнению с альтернативой, что это не 0. Затем вычислите двустороннее значение p для статистики теста. , В целом статистическая значимость означает среднее значение р <= 0,05. Иногда для определения статистической значимости используются другие значения (например, 0,01). Большинство пакетов программного обеспечения временных рядов, которые включают несколько временных рядов, могут выполнить эти тесты для вас. Наш друг IrishStat может говорить об этом относительно Autobox.
Майкл Р. Черник
Существуют ли случаи, когда взаимная корреляция при нулевом лаге и Пирсоне различна?
Bakaburg
4

Возможно, вы захотите взглянуть на аналогичный вопрос и на мой ответ Корреляция временных рядов по объему, в которых предполагается, что вы можете вычислять кросс-корреляции, НО их тестирование представляет собой лошадь другого цвета (лошади другого оттенка) из-за авторегрессии или детерминированной структуры в любом из них. серии.

IrishStat
источник
если я правильно понимаю, в этом ответе вы говорите, что взаимная корреляция между временными сериями бесполезна.
BBDynSys
user423805 МОЖЕТ быть бесполезным, если данные не будут предварительно отфильтрованы для получения IID. Это напрямую говорит о реальной обеспокоенности ОП по поводу ложных выводов, таких как «аисты, приносящие детей» J. Neyman 1938 en.wikipedia.org/wiki/… and amstat.org/about / statisticsiansinhistory /… "и т. д. (я могу вспомнить некоторые примеры, в которых линейно другой экспоненциально растущий временной ряд не имел бы отношения друг к другу, но приведенные выше вычисления сообщали бы о их корреляции.)
IrishStat
Я думаю, дело в том, что ряды должны быть стационарными, чтобы взаимные корреляции имели смысл. Если необходима фильтрация, это означает, что ряд данных является стационарным (например, дифференцирование или сезонное дифференцирование). Но называть это бесполезным - неправильно.
Майкл Р. Черник
@ Майкл, я сказал, МОЖЕТ быть бесполезным.
IrishStat
@IrishStat Это был хороший комментарий, который вернул меня к тренировкам в 1970-х годах. В то время я изучал временные ряды / методы прогнозирования моей гражданской работы в армии США. Мы использовали экспоненциальное сглаживание как способ прогнозирования на основе исторических данных, а не субъективных оценок, которые использовались на складах предложения. Кто-то сделал мне отличное предложение взглянуть на более общие модели ARIMA и текст Бокса и Дженкинса 1970 года, и поэтому я начал интересоваться временными сериями, которые стали частью моей карьеры.
Майкл Р. Черник
-1

Здесь есть кое-что интересное

/programming/3949226/calculating-pearson-correlation-and-significance-in-python

Это было на самом деле то, что мне было нужно. Прост в реализации и объяснении.

BBDynSys
источник
2
-1 Из того, что я могу собрать, эти ответы касаются только стандартной корреляции Пирсона и момента продукта. Применительно к двум временным рядам стандартная корреляция Пирсона дает бессмысленные результаты! Если вы будете следовать этим советам, все, что вы делаете, это производите статистические артефакты. См. Например, math.mcgill.ca/dstephens/OldCourses/204-2007/Handouts/…
Момо