Просто общий вопрос. Если у вас есть данные временных рядов, когда лучше использовать методы временных рядов (иначе, ARCH, GARCH и т. Д.), А не методы машинного / статистического обучения (KNN, регрессия)? Если есть аналогичный вопрос, который существует на перекрестном утверждении, пожалуйста, укажите мне на него - посмотрел и не смог найти.
10
Ответы:
Типичные методы машинного обучения предполагают, что ваши данные независимы и одинаково распределены, что не относится к данным временных рядов. Поэтому они находятся в невыгодном положении по сравнению с методами временных рядов с точки зрения точности. Примеры этого см. В предыдущих вопросах. Упорядочение временных рядов для машинного обучения и случайного леса переоснащается .
источник
Фрэнсис Диболд недавно опубликовал в своем блоге «ML и метрики VI: ключевое различие между эконометрикой ML и TS» . Я предоставляю сокращенную версию этого, так что вся заслуга идет к нему. (Выделение жирным шрифтом - мое.)
Таким образом, вывод таков:
Я рекомендую прочитать весь оригинальный пост здесь .
источник
Как заметил @Tom Minka, большинство методов ML предполагают ввод данных. Хотя есть несколько решений:
Можно использовать все прошлые выборки временных рядов в системе «Память» как один вектор признаков, то есть: x = [x (t-1), x (t-2), ... x (tM)]. Однако у этого есть 2 проблемы: 1) в зависимости от вашего биннинга, у вас может быть огромный вектор характеристик 2 - некоторые методы требуют, чтобы функции в векторе функций были независимыми, что здесь не так.
Существует много методов ML, которые специально разработаны для таких данных временных рядов, например, скрытые марковские модели, которые очень успешно используются для обнаружения приступов, обработки речи и т. Д.
Наконец, подход, который я выбрал, заключается в использовании методов «выделения признаков» для преобразования задачи динамической регрессии (в которой есть элемент времени) в статическую. Например, подход с использованием режима основной динамики (PDM) отображает входной прошедший вектор признаков ([x (t-1), x (t-2), ... x (tM)]) на статический ([v ( 1), v (2), .. v (L)]), свернув прошлое с системно-линейным линейным набором фильтров (PDM), см. Marmarelis, 2004 г. book or Marmarelis, Vasilis Z. «Методология моделирования для нелинейных физиологических систем». «. Летопись биомедицинской инженерии 25.2 (1997): 239-251 ...
источник