Почему автокорреляция так важна? Я понял принцип этого (я думаю ..), но поскольку есть также примеры, где не происходит автокорреляции, я задаюсь вопросом: не все ли в природе как-то автокоррелировано? Последний аспект больше нацелен на общее понимание самой автокорреляции, потому что, как я уже говорил, не зависит ли каждое состояние во вселенной от предыдущего?
22
Ответы:
Автокорреляция имеет несколько интерпретаций на простом языке, которые означают, что неавтокоррелированные процессы и модели не имеют:
Автокоррелированная переменная имеет память своих предыдущих значений. Такие переменные имеют поведение, которое зависит от того, что было раньше. Память может быть длинной или короткой относительно периода наблюдения; память может быть бесконечной; память может быть отрицательной (то есть может колебаться). Если ваши руководящие теории говорят, что прошлое (переменной) остается с нами, тогда автокорреляция является выражением этого. (См., Например, Boef, SD (2001). Моделирование отношений равновесия: модели коррекции ошибок с сильно авторегрессивными данными . Политический анализ , 9 (1), 78–94, а также de Boef, S., & Keele, L. ( 2008). Серьезно принимая время . Американский журнал политических наук , 52 (1), 184–200.)
Автокоррелированная переменная подразумевает динамическую систему . Вопросы, которые мы задаем и отвечаем о поведении динамических систем, отличаются от тех, которые мы задаем о нединамических системах. Например, когда причинные эффекты попадают в систему и как долго эффекты от возмущения в определенный момент времени остаются актуальными, на языке автокоррелированных моделей отвечают. (См., Например, Левинс Р. (1998). Диалектика и теория систем . Наука и общество , 62 (3), 375–399, а также цитата из Песарана ниже.)
Автокоррелированная переменная подразумевает необходимость моделирования временных рядов (если не моделирования динамических систем также). Методологии временных рядов основаны на авторегрессивном поведении (и скользящем среднем, которое является допущением моделирования о зависящей от времени структуре ошибок), пытающихся захватить существенные детали процесса генерации данных , и находятся в явном контрасте, например, с называемые «продольными моделями», которые просто включают некоторую меру времени в качестве переменной в иначе динамической модели без автокорреляции. См., Например, Pesaran, MH (2015). Временные ряды и панельные данные в Econometrics , Нью-Йорк, NY: Oxford University Press.
Предостережение: я использую «авторегрессию» и «авторегрессию», чтобы подразумевать любую структуру памяти для переменной в целом, независимо от краткосрочных, долгосрочных, единичных корней, взрывчатых и т. Д. Свойств этого процесса.
источник
Попытка ответа.
Автокорреляция ничем не отличается от любых других отношений между предикторами. Просто предиктор и зависимая переменная оказываются одним и тем же временным рядом, только с запаздыванием.
Да, в самом деле. Точно так же, как состояние каждого объекта во вселенной зависит от состояния каждого другого объекта через все виды физических сил. Вопрос только в том, достаточно ли сильны отношения, чтобы их можно было обнаружить, или достаточно сильны, чтобы помочь нам в прогнозировании состояний.
И то же самое относится и к автокорреляции. Это всегда там. Вопрос в том, нужно ли нам его моделировать, или моделирование просто вносит дополнительную неопределенность (компромисс дисперсии), делая нас хуже, чем не моделируя это.
Пример из моей личной работы: я прогнозирую продажи в супермаркете. Потребление молока в моей семье довольно регулярное. Если я не покупал молоко в течение трех или четырех дней, велики шансы, что я приду сегодня или завтра, чтобы купить молоко. Если супермаркет хочет спрогнозировать потребность моей семьи в молоке, они должны во что бы то ни стало принять во внимание эту автокорреляцию.
Однако я не единственный покупатель в моем супермаркете. Там, может быть, еще 2000 домохозяйств покупают продукты. Потребление молока у каждого снова автоматически коррелируется. Но поскольку скорость потребления у всех разная, автокорреляция в совокупности настолько ослаблена, что может не иметь смысла ее моделировать. Он исчез в общем ежедневном спросе, то есть в перехвате. А поскольку супермаркету все равно, кому он продает молоко, он будет моделировать совокупный спрос и, возможно, не включать автокорреляцию.
(Да, существует внутринедельная сезонность. Это своего рода автокорреляция, но она действительно зависит от дня недели, а не от спроса в тот же день недели неделей ранее, поэтому это скорее эффект дня недели, чем сезонная автокорреляция. )
источник
Во-первых, я думаю, что вы имеете в виду, какова цель оценки автокорреляции и борьбы с ней. Если вы действительно имеете в виду «цель автокорреляции», то это философия, а не статистика.
Во-вторых, состояния вселенной связаны с предыдущими состояниями, но не каждая статистическая проблема имеет дело с предыдущими состояниями природы. Многие исследования являются поперечными.
В-третьих, мы должны смоделировать это, когда это там? Методы делают предположения. Большинство форм регрессии предполагают отсутствие автокорреляции (то есть ошибки независимы). Если мы нарушим это предположение, тогда наши результаты могут быть неверными. Как далеко не так? Один из способов сказать это - сделать обычную регрессию, а также некоторую модель, которая учитывает автокорреляцию (например, многоуровневые модели или методы временных рядов) и посмотреть, насколько различаются результаты. Но, как мне кажется, учет автокорреляции в целом уменьшит шум и сделает модель более точной.
источник