Говоря о продольных данных, мы можем многократно ссылаться на данные, собранные с течением времени от одного и того же субъекта / единицы исследования, таким образом, существуют корреляции для наблюдений внутри одного и того же субъекта, т. Е. Сходство внутри объекта.
Говоря о данных временного ряда, мы также ссылаемся на данные, собранные за ряд времени, и они кажутся очень похожими на продольную установку, упомянутую выше.
Мне интересно, если кто-то может дать четкое разъяснение между этими двумя терминами, каковы отношения и каковы различия?
time-series
terminology
panel-data
askming
источник
источник
Ответы:
Я сомневаюсь, что существуют строгие формальные определения, с которыми согласен широкий круг аналитиков данных.
В целом, однако, временные ряды обозначают одну единицу исследования, наблюдаемую через регулярные интервалы в течение очень длительного периода времени. Типичным примером может служить ежегодный рост ВВП страны в течение десятилетий или даже более ста лет. Для аналитика, работающего в частной компании, это может быть ежемесячный доход от продаж в течение всей жизни компании. Поскольку существует так много наблюдений, данные анализируются очень детально, в поисках таких вещей, как сезонность за разные периоды (например, ежемесячно: больше продаж в начале месяца сразу после того, как людям заплатили; ежегодно: больше продаж в ноябре и Декабрь, когда люди делают покупки к Рождеству) и, возможно, смены режимов. Прогнозирование часто очень важно, как отмечает @StephanKolassa.
Продольный тип обычно относится к меньшему количеству измерений по большему количеству единиц исследования. Примером-прототипом может служить исследование лекарств, где сотни пациентов измеряются в начале исследования (до лечения) и ежемесячно в течение следующих 3 месяцев. С помощью всего лишь 4 наблюдений за каждой единицей в этом примере невозможно попытаться определить виды функций, которые интересуют аналитиков временных рядов. С другой стороны, когда пациенты предположительно рандомизированы в группы лечения и контроля, причинность можно определить один раз. несостоятельность была решена. Как следует из вышесказанного, зачастую отсутствие независимости считается почти неприятностью, а не основной особенностью интереса.
источник
Существует примерно три вида наборов данных:
источник
Эти два термина, возможно, не связаны в том смысле, в каком предполагает ОП - т.е. я не думаю, что они являются конкурирующими способами анализа.
Вместо этого анализ временных рядов описывает набор методов более низкого уровня, которые могут быть полезны для анализа данных в продольном исследовании.
Объектом исследования в анализе временных рядов является некоторый зависящий от времени сигнал.
Большинство методов для анализа и моделирования / прогнозирования этих зависящих от времени сигналов основаны на предпосылке, что эти сигналы разлагаются на различные компоненты. Два наиболее важных:
циклические компоненты (например, ежедневно, еженедельно, ежемесячно, сезонно); и
тенденция
Другими словами, анализ временных рядов основан на использовании циклического характера зависящего от времени сигнала для извлечения основного сигнала.
источник
Для простоты я буду предполагать изучение отдельных лиц, но то же самое относится и к любой единице анализа. Это не сложно, временные ряды - это данные, собранные во времени, обычно подразумевающие одно и то же измерение из эквивалентной совокупности в отдельные интервалы времени - или собираемые непрерывно, но анализируемые через интервалы времени.
Продольные данные намного шире по объему. Эквивалентная совокупность заменяется идентичной совокупностью, поэтому отдельные данные могут быть спарены или объединены с течением времени. Продольные данные могут повторяться измерениями или нет в зависимости от цели исследования. Когда Продольные данные выглядят как временные ряды, это когда мы измеряем одно и то же во времени. Большая разница в том, что во временном ряду мы можем измерить общее изменение измерения во времени (или по группам), тогда как при продольном анализе вы фактически измеряете изменение на отдельном уровне. Таким образом, у вас гораздо больше возможностей для анализа, и измерение изменений без ошибок, если проводится выборка, поэтому продольное исследование может быть более точным и информативным.
источник