Я пытаюсь научиться использовать нейронные сети. Я читал этот урок .
После подбора нейронной сети по временному ряду, используя значение в для прогнозирования значения в момент времени t + 1, автор получает следующий график, где синяя линия - это временной ряд, зеленый - это прогноз данных поезда, красный - это прогноз на тестовых данных (он использовал разделение тест-поезд)
и называет это «Мы видим, что модель довольно плохо справилась с подбором как обучающих, так и тестовых наборов данных. Она в основном предсказывала то же входное значение, что и выходной».
и говорит: «Глядя на график, мы видим больше структуры в прогнозах».
Мой вопрос
Почему первый "бедный"? это выглядит почти идеально для меня, он предсказывает каждое изменение совершенно!
И аналогично, почему второй лучше? Где эта «структура»? Мне это кажется намного беднее, чем первый.
В общем, когда прогноз по временным рядам хорош, а когда плох?
Ответы:
Это своего рода оптическая иллюзия: глаз смотрит на график и видит, что красный и синий графики находятся рядом с каждым. Проблема в том, что они находятся рядом друг с другом по горизонтали , но важна вертикальрасстояние. Глазу легче всего увидеть расстояние между кривыми в двумерном пространстве декартова графа, но важна одномерная дистанция в пределах определенного значения t. Например, предположим, что у нас были точки A1 = (10 100), A2 = (10,1, 90), A3 = (9,8,85), P1 = (10,1 100,1) и P2 = (9,8, 88). Глаз, естественно, будет сравнивать P1 с A1, потому что это самая близкая точка, в то время как P2 будет сравниваться с A2. Поскольку P1 ближе к A1, чем P2 к A3, P1 будет выглядеть как лучший прогноз. Но когда вы сравниваете P1 с A1, вы просто смотрите, насколько хорошо A1 может просто повторить то, что видел ранее; в отношении A1, P1 не является прогнозом, Правильное сравнение между P1 v. A2 и P2 v. A3, и в этом сравнении P2 лучше, чем P1. Было бы яснее, если бы, помимо построения y_actual и y_pred против t, были графики (y_pred-y_actual) против t.
источник
Это так называемый «сдвинутый» прогноз. Если вы посмотрите более внимательно на график 1, вы увидите, что сила предсказания заключается только в копировании почти точно последнего увиденного значения. Это означает, что модель ничему не научилась лучше, и она рассматривает временные ряды как случайную прогулку. Я предполагаю, что проблема может заключаться в том, что вы используете необработанные данные, которые вы передаете в нейронную сеть. Эти данные не являются стационарными, что вызывает все проблемы.
источник