Вопрос по образцу автоковариантной функции

10

Я читаю книгу анализа временных рядов, и формула для автоковариации образца определена в книге как:

γ^(час)знак равноN-1ΣTзнак равно1N-час(ИксT+час-Икс¯)(ИксT-Икс¯)

сдля . - это среднее.γ^(h)=γ^(h)ˉ xчасзнак равно0,1,,,,,N-1Икс¯

Может кто-нибудь интуитивно объяснить, почему мы делим сумму на а не на ? В книге объясняется, что это потому, что приведенная выше формула является неотрицательно определенной функцией, и поэтому деление на является предпочтительным, но мне это не ясно. Может кто-то может это доказать или показать пример или что-то?п - ч пNN-часN

Для меня интуитивной вещью сначала было бы разделить на . Это объективная или предвзятая оценка автоковариации?N-час

jjepsuomi
источник
1
Если ваш временной ряд точно равен а все остальные , или неизвестны, то сумма обязательно должна остановиться на когда происходит в сумма: следующий член (для ), который будет включен в сумму, будет содержать и не является частью образца. x i i < 1 i > n t = n - h x t + h = x n t = n - h + 1 x n - h + 1 + h = x n + 1 х н + 1Икс1,Икс2,...,ИксNИксяя<1я>NTзнак равноN-часИксT+часзнак равноИксNt=nh+1xnh+1+h=xn+1xn+1
Дилип Сарват
@Dilip Я не думаю, что это проблема: вопрос касается того, делить ли на или в определении . п - ч γnnhγ^
whuber

Ответы:

14

т1,т2,...,ткхт1,Хт2,...,Хтк( γ (тя-тJ),1я,JK)γ^ используется для создания ковариационных матриц: учитывая "времена" , он оценивает ковариацию случайного вектора (полученный из случайного поля в то время) - это матрица . Для многих проблем, таких как прогнозирование, крайне важно, чтобы все такие матрицы были неособыми. Как предполагаемые ковариационные матрицы, очевидно, что они не могут иметь никаких отрицательных собственных значений, поэтому все они должны быть положительно определенными.t1,t2,,tkXt1,Xt2,,Xtk(γ^(titj),1i,jk)

Простейшая ситуация, при которой проводится различие между двумя формулами

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

а также

γ^0(h)=(nh)1t=1nh(xt+hx¯)(xtx¯)

появляется, когда имеет длину ; скажем, . Для и вычислить2 x = ( 0 , 1 ) t 1 = t t 2 = t + 1x2x=(0,1)t1=tt2=t+1

γ^0=(14141414),

который является единственным, тогда как

γ^=(14181814)

который имеет собственные значения и , откуда он положительно определен.1 / 83/81/8

Аналогичное явление происходит для , где положительно определен, но при применении к временам , скажем - вырождается в матрицу ранга (ее записи чередуются между и ).gamma & gamma 0 т я = ( 1 , 2 , 3 , 4 ) 1 1 / 4 - 1 / 4x=(0,1,0,1)γ^γ^0ti=(1,2,3,4)11/41/4

(Здесь есть образец: проблемы возникают для любого вида .)( а , б , а , б , , а , б )x(a,b,a,b,,a,b)

В большинстве приложений серия наблюдений настолько длинна, что для большинства представляющих интерес - которые намного меньше, чем - разница между и не имеет значения. Таким образом, на практике это различие не имеет большого значения, и теоретически необходимость в положительной определенности решительно отвергает любое возможное стремление к объективным оценкам. h n n - 1 ( n - h ) - 1xthnn1(nh)1

Whuber
источник
1
Я думаю, что важно отметить, что обе оценки являются смещенными оценками, даже если вы делите их на nh.
Ран
@Ran Хотя вы правы в том, что эти оценки являются предвзятыми, я не согласен с тем, что это важная проблема: как упоминалось в последнем абзаце, небольшая предвзятость - это наименьшее беспокойство. Объективная оценка, использующая , едва ли отличается от или . gamma & gamma 0(N-час-1)-1γ^γ^0
whuber
2
Очень хороший ответ +1. Возможно, полезно добавить пункт, что , тогда как , поэтому, когда близко к , оценка может быть ошибочной, в то время как будет иметь равномерно небольшие флуктуации выборки , См., Например, Priestly (1981) «Спектральный анализ и временные ряды» p324 для подробного обсуждения этого вопросаVγ^0(h)=O(1/(nh))Vγ^(h)=O(1/n)hnγ^0(h)γ^(h)час
Colin T Bowers