Данные: я недавно работал над анализом стохастических свойств пространственно-временного поля ошибок прогноза производства энергии ветра. Формально можно сказать, что это процесс индексируются дважды во времени (сtиh) и один раз в пространстве (p), гдеH- это количество времени просмотра вперед (равно примерно24, регулярно выбирается),T- это число «время прогноза» (т. е. время выдачи прогноза, около 30000 в моем случае, с регулярной выборкой), аn- количество пространственных позиций (без сетки, около 300 в моем случае). Поскольку это процесс, связанный с погодой, у меня также есть много прогнозов погоды, анализа, метеорологических измерений, которые можно использовать.
Вопрос: Можете ли вы описать мне предварительный анализ данных такого типа, чтобы понять природу структуры взаимозависимости (которая может быть не линейной) процесса, чтобы предложить его точное моделирование.
Ответы:
Мне кажется, что у вас достаточно данных, чтобы смоделировать зависимость от пространственно-временного и метеорологического влияний как смещения ошибок прогноза (т. Е. Тенденции систематически переоценивать / недооценивать [первый момент]), так и их дисперсию [второй момент].
Для исследования предвзятости я бы просто сделал много диаграмм рассеяния, тепловых карт или гексбинов. Для исследования изменчивости я бы просто возместил исходные ошибки, а затем снова сделал много диаграмм рассеяния, тепловых карт или гексбинов. Это, конечно, не совсем беспроблемно, если у вас много предубеждений, но все же может помочь увидеть закономерности гетероскедастичности под влиянием ковариат.
R
mboost
источник
Мы (коллега и я) наконец-то написали статью об этом. Подводя итог, мы предложили два решения для количественной оценки и предоставления статистической сводки (пространственно-временного) распространения ошибок вдоль Дании и в будущем.
Это может быть использовано для вычисления глобального вектора распространения, то есть некоторого вида пространственного среднего скоростей распространения между парами. Часть этого показана в левой части рисунка 1, и угадайте, какое распространение ошибок имеет Запад-Восток в Денамрке (хорошо, это не было большим сюрпризом :)). Мы также проанализировали это условно для различных метеорологических ситуаций, чтобы показать связь между распространением и ветром (скорость, направление).
Во втором случае мы наблюдали, что средняя временная скорость распространения имеет величину, аналогичную величине, полученной с помощью пространственного среднего в первом случае. Если вы хотите посмотреть на эту работу более серьезно, статья здесь .
источник