Каковы различия между терминами «анализ временных рядов» и «анализ продольных данных»

17

Говоря о продольных данных, мы можем многократно ссылаться на данные, собранные с течением времени от одного и того же субъекта / единицы исследования, таким образом, существуют корреляции для наблюдений внутри одного и того же субъекта, т. Е. Сходство внутри объекта.

Говоря о данных временного ряда, мы также ссылаемся на данные, собранные за ряд времени, и они кажутся очень похожими на продольную установку, упомянутую выше.

Мне интересно, если кто-то может дать четкое разъяснение между этими двумя терминами, каковы отношения и каковы различия?

askming
источник
1
Это может превратиться в опрос ... Я работал с обоими типами данных, и одно из ключевых отличий заключается в том, что продольные данные часто используются в причинно-следственном анализе, чтобы понять влияние вмешательств или обработок, тогда как временные ряды часто используются в прогнозировании . Конечно, разница не является четкой (вам необходимо понимать основные движущие силы для прогнозирования, и, по-моему, вы не поняли эти движущие факторы, если не можете хорошо прогнозировать). Но люди, которые обнаруживают сигналы во временных рядах, часто не слишком заботятся о прогнозировании, поэтому они, вероятно, отвергнут мое различие.
С. Коласса - Восстановить Монику
Спасибо за ваши комментарии. Но я думаю, что термин «причинно-следственная связь» может не подходить здесь, а термин «ассоциация» должен быть лучше? С точки зрения цели анализа данных, я думаю, что ваши комментарии имели какой-то смысл для меня. Но мы не можем использовать продольные данные, чтобы сделать прогноз? Так как это также данные временных рядов.
спрашиваю
1
У вас есть точка «причинно-следственная связь» против «ассоциации», и, конечно, для прогнозирования можно использовать продольные данные - просто я не часто вижу эти две концепции вместе. Синоптики обычно говорят о временных рядах. Кроме того, я не мог сказать это лучше, чем @gung.
С. Коласса - Восстановить Монику
3
Одним из возможных типичных (не дефиниционных) различий в том , что во временных рядах вы видите и модели время ответ в зависимости от т - 1 состояния; это эффект переноса . При продольном анализе времени вы обычно рассматриваете время как постоянный , эволюционный фоновый фактор. TT-1
ttnphns
4
См. Также другие темы, например stats.stackexchange.com/questions/7110/… stats.stackexchange.com/questions/11413/…
Ник Кокс,

Ответы:

19

Я сомневаюсь, что существуют строгие формальные определения, с которыми согласен широкий круг аналитиков данных.

В целом, однако, временные ряды обозначают одну единицу исследования, наблюдаемую через регулярные интервалы в течение очень длительного периода времени. Типичным примером может служить ежегодный рост ВВП страны в течение десятилетий или даже более ста лет. Для аналитика, работающего в частной компании, это может быть ежемесячный доход от продаж в течение всей жизни компании. Поскольку существует так много наблюдений, данные анализируются очень детально, в поисках таких вещей, как сезонность за разные периоды (например, ежемесячно: больше продаж в начале месяца сразу после того, как людям заплатили; ежегодно: больше продаж в ноябре и Декабрь, когда люди делают покупки к Рождеству) и, возможно, смены режимов. Прогнозирование часто очень важно, как отмечает @StephanKolassa.

Продольный тип обычно относится к меньшему количеству измерений по большему количеству единиц исследования. Примером-прототипом может служить исследование лекарств, где сотни пациентов измеряются в начале исследования (до лечения) и ежемесячно в течение следующих 3 месяцев. С помощью всего лишь 4 наблюдений за каждой единицей в этом примере невозможно попытаться определить виды функций, которые интересуют аналитиков временных рядов. С другой стороны, когда пациенты предположительно рандомизированы в группы лечения и контроля, причинность можно определить один раз. несостоятельность была решена. Как следует из вышесказанного, зачастую отсутствие независимости считается почти неприятностью, а не основной особенностью интереса.

Gung - Восстановить Монику
источник
8

Существует примерно три вида наборов данных:

  • сечение: разные предметы одновременно; думать об этом как о одной строке с множеством столбцов, соответствующих различным предметам;
  • временные ряды: один и тот же предмет в разное время; думать об этом как об одном столбце со строками, соответствующими разным моментам времени;
  • панель (продольная): много предметов в разное время, у вас один и тот же предмет в разное время, и у вас много предметов одновременно; думайте об этом как о таблице, где строки - это временные точки, а столбцы - предметы.
Аксакал
источник
2
Основываясь на ваших комментариях, кажется, что продольные данные представляют собой набор данных нескольких временных рядов, собранных по разным предметам?
спрашиваю
1
Как правило, да, вы можете увидеть данные каждого субъекта как временные ряды. На практике, однако, продольные данные часто имеют очень мало временных точек для каждого субъекта. Они называют моменты времени волнами . Например, это может быть медицинское исследование, где каждый пациент имеет 4-5 наблюдений с ежемесячными интервалами, а сотни пациентов в течение нескольких лет. Таким образом, наборы панельных данных часто являются несбалансированными (например, очень скудная таблица), поэтому у продольных исследований есть свои любимые методы для решения этой проблемы.
Аксакал
Это полезно, учитывая вопрос, но есть много других типов наборов данных, которые не подпадают ни под один из этих заголовков. Тем не менее, они не имеют отношения к вопросу, и попытка классифицировать все возможные типы данных здесь была бы бесполезной. Примеры: любой набор данных, в котором основная структура является субъектом x субъектом; любой набор данных, который не является двумерным.
Ник Кокс
@NickCox, правда, но я в эконометрике, и эти три из них с развитыми теориями, и в основном используются в нашей области
Аксакал,
2
Без сомнения, вы, но ничто в этом вопросе не обязывает или даже не поощряет узконаправленную эконометрическую точку зрения, и при этом ваша конкретная точка зрения не была четко изложена.
Ник Кокс
3

Эти два термина, возможно, не связаны в том смысле, в каком предполагает ОП - т.е. я не думаю, что они являются конкурирующими способами анализа.

Вместо этого анализ временных рядов описывает набор методов более низкого уровня, которые могут быть полезны для анализа данных в продольном исследовании.

Объектом исследования в анализе временных рядов является некоторый зависящий от времени сигнал.

Большинство методов для анализа и моделирования / прогнозирования этих зависящих от времени сигналов основаны на предпосылке, что эти сигналы разлагаются на различные компоненты. Два наиболее важных:

  • циклические компоненты (например, ежедневно, еженедельно, ежемесячно, сезонно); и

  • тенденция

Другими словами, анализ временных рядов основан на использовании циклического характера зависящего от времени сигнала для извлечения основного сигнала.

Дуг
источник
0

Для простоты я буду предполагать изучение отдельных лиц, но то же самое относится и к любой единице анализа. Это не сложно, временные ряды - это данные, собранные во времени, обычно подразумевающие одно и то же измерение из эквивалентной совокупности в отдельные интервалы времени - или собираемые непрерывно, но анализируемые через интервалы времени.
Продольные данные намного шире по объему. Эквивалентная совокупность заменяется идентичной совокупностью, поэтому отдельные данные могут быть спарены или объединены с течением времени. Продольные данные могут повторяться измерениями или нет в зависимости от цели исследования. Когда Продольные данные выглядят как временные ряды, это когда мы измеряем одно и то же во времени. Большая разница в том, что во временном ряду мы можем измерить общее изменение измерения во времени (или по группам), тогда как при продольном анализе вы фактически измеряете изменение на отдельном уровне. Таким образом, у вас гораздо больше возможностей для анализа, и измерение изменений без ошибок, если проводится выборка, поэтому продольное исследование может быть более точным и информативным.

dre0303
источник