У меня есть временной ряд измерений (высота-одномерный ряд). В период наблюдения процесс измерения замедлился на несколько моментов времени. Таким образом, полученные данные представляют собой вектор с NaN, где в данных были пробелы. Используя MATLAB, это вызывает у меня проблему при вычислении автокорреляции ( autocorr
) и применении нейронных сетей ( nnstart
).
Как следует обращаться с этими пробелами / NaN? Должен ли я просто удалить их из вектора? Или заменить их запись интерполированным значением? (если так, как в MATLAB)
Есть некоторые алгоритмы, которые неуязвимы для пропущенных значений, поэтому предпочтительным решением является их поиск (например, R
acf
для автокорреляции).В общем случае, можно пойти или просто отбросить данные с отсутствующими наблюдениями (может быть очень болезненным) или просто вписать их значения - среднего значения соседей может быть достаточно для гладких рядов и небольших разрывов, но, конечно, есть множество других более мощных методов, использующих сплайны, случайные / наиболее частые значения, вменение из моделей и т. д.
источник
Используйте Intervention Detection для определения недостающих долин, используя полезную структуру ARIMA и любые локальные тренды времени и / или сдвиги уровней.
источник
Здесь есть 2 проблемы. Во-первых, это обеспечивает значимую числовую основу для вашего автокорреляционного ответа в Matlab. чтобы это произошло, вам нужно растянуть и / или исправить часть временных рядов ваших векторов данных ... этот компонент проблемы целостности данных является наиболее фундаментальным.
во-вторых, вам нужно решить, как обрабатывать компонент «значение» вашего вектора ... это зависит в значительной степени от конкретного приложения от того, что лучше всего предполагать (например, небольшие отсутствующие метки времени и соответствующие NaN или Нули могут быть безопасно интерполированы от его соседей ... в больших промежутках установка значения в ноль, вероятно, более безопасна ... или вменяется, как рекомендовано выше - очевидно, чтобы это было значимым, пробелы снова должны быть сравнительно небольшими.) ,
источник