Скажем, у меня есть ряд временных рядов, например, ряд записей температуры с разных станций в регионе. Я хочу получить единый температурный рекорд для всего региона, с помощью которого я мог бы описать аспекты регионального климата. Интуитивный подход может заключаться в том, чтобы просто брать среднее значение по всем станциям на каждом временном шаге, но мое статистическое чувство паука (с которым я определенно еще не очень хорошо знаком) говорит мне, что это может быть не так просто. В частности, я предполагаю, что усреднение по всему региону удалит некоторые интересные экстремальные температуры, и у меня могут возникнуть проблемы с зависимостью между близкими станциями.
С какими еще проблемами я мог бы столкнуться, если бы попробовал подобную стратегию, и есть ли способы их преодоления или более разумные способы объединения данных такого типа?
Примечание. Ответы могут быть более общими, чем приведенный мною пространственный пример.
источник
Ответы:
Во-первых, я хотел бы сказать, что я буду добавлять комментарий, но я пока не могу этого сделать (респ), но мне нравится вопрос и я хочу принять участие, так что вот «ответ». Также я вижу, что это старо, но интересно.
Во-первых, можно ли использовать метод уменьшения размеров, такой как PCA, для сжатия временных рядов? Если первое собственное значение велико, возможно, это означает, что использование вами собственного вектора будет представлять большую часть динамики.
Во-вторых, и в целом, как вы предпочитаете использовать временные ряды? Не зная многого другого, я бы предположил, что температура может немного отличаться. Например, если некоторые температурные рекорды находятся вблизи городов, вы можете получить эффект типа «острова тепла». Или, возможно, небольшое изменение бокового расстояния приводит к значительному изменению вертикального расстояния - одно местоположение может быть на уровне моря и прямо на берегу океана, а другое - не «слишком далеко», а на высоте в километр. У них определенно будут разные температуры!
Это всего лишь некоторые мысли. Может быть, кто-то еще может прыгнуть и дать лучший ответ.
источник