Это немного легкомысленный вопрос, но у меня есть серьезный интерес к ответу. Я работаю в психиатрической больнице, и у меня есть данные за три года, собираемые каждый день по каждому отделению, относительно уровня насилия в этом отделении.
Очевидно, что модель, которая соответствует этим данным, является моделью временного ряда. Я должен был изменить счет, чтобы сделать их более нормальными. Я подобрал модель ARMA с разностными данными, и я считаю, что лучше всего подойдет модель с разной степенью разности и автокорреляцией первого порядка при лаг 2
Мой вопрос: для чего я могу использовать эту модель? Временные ряды всегда кажутся такими полезными в учебниках, когда речь идет о популяциях зайцев и ценах на нефть, но теперь я сделал свой собственный результат, который кажется настолько абстрактным, что он совершенно непрозрачен. Разные оценки коррелируют друг с другом на втором отставании, но я не могу посоветовать всем быть в состоянии повышенной готовности через два дня после серьезного инцидента со всей серьезностью.
Или я могу?
источник
Ответы:
Модель, которая соответствует данным, не должна быть моделью временного ряда; Я бы посоветовал немного подумать нестандартно.
Если у вас есть несколько переменных (например, возраст, пол, диета, этническая принадлежность, болезнь, лекарства), вы можете использовать их для другой модели. Может быть, наличие определенных пациентов в одной комнате является важным предиктором? Или, возможно, это связано с обслуживающим персоналом? Или рассмотрите возможность использования модели с различными вариациями временных рядов (например, VECM), если у вас есть другие переменные, которые вы можете использовать. Посмотрите на отношения между насилием между пациентами: действуют ли определенные пациенты вместе?
Модель временного ряда полезна, если время играет важную роль в поведении. Например, может быть кластер насилия. Посмотрите на литературу по кластеризации волатильности. Как предполагает @Jonas, с задержкой порядка 2, вам может потребоваться быть более внимательным в день, следующий за вспышкой насилия. Но это не поможет вам предотвратить первый день: может существовать другая информация, которую вы можете связать с анализом, чтобы на самом деле понять причину насилия, а не просто прогнозировать ее в виде временных рядов.
Наконец, в качестве технического предложения: если вы используете R для анализа, вы можете взглянуть на пакет прогноза от Роба Хиндмана (создателя этого сайта). Это имеет много очень приятных особенностей; см. статью «Автоматическое прогнозирование временных рядов: пакет прогноза для R» в журнале статистического программного обеспечения.
источник
Вы приспособили модель к различиям, что означает, что вы описываете изменение уровня насилия. Вы получаете лаг на 2 дня. Отставание указывает на память процесса. Другими словами, изменение уровня насилия сегодня зависит от изменения уровня насилия за последние два дня. В более длительных временных масштабах вклад случайных влияний становится достаточно сильным, так что четкой связи больше нет.
Автокорреляция положительна? Затем изменение уровня насилия сегодня предполагает аналогичное изменение уровня насилия за два дня. Это отрицательно? Тогда насилие может остаться выше в течение двух дней.
Конечно, вы можете захотеть контролировать смешанные эффекты. Например, после серьезного инцидента люди могут с большей вероятностью сообщать о незначительных инцидентах, но эта «сенсибилизация» исчезнет через два дня.
источник