Использование анализа временных рядов для анализа / прогнозирования насильственного поведения

13

Это немного легкомысленный вопрос, но у меня есть серьезный интерес к ответу. Я работаю в психиатрической больнице, и у меня есть данные за три года, собираемые каждый день по каждому отделению, относительно уровня насилия в этом отделении.

Очевидно, что модель, которая соответствует этим данным, является моделью временного ряда. Я должен был изменить счет, чтобы сделать их более нормальными. Я подобрал модель ARMA с разностными данными, и я считаю, что лучше всего подойдет модель с разной степенью разности и автокорреляцией первого порядка при лаг 2

Мой вопрос: для чего я могу использовать эту модель? Временные ряды всегда кажутся такими полезными в учебниках, когда речь идет о популяциях зайцев и ценах на нефть, но теперь я сделал свой собственный результат, который кажется настолько абстрактным, что он совершенно непрозрачен. Разные оценки коррелируют друг с другом на втором отставании, но я не могу посоветовать всем быть в состоянии повышенной готовности через два дня после серьезного инцидента со всей серьезностью.

Или я могу?

Крис Били
источник
Не могли бы вы отредактировать заголовок примерно так: «Использование анализа временных рядов для анализа / прогнозирования насильственного поведения»?
Пол
1
Мне действительно нравится этот тип вопроса, я думаю, что этот тип реальной реальной проблемы увеличит интерес к сайту. Было бы еще лучше, если бы у вас была возможность добавить ссылку на данные или рассказать нам (в качестве дополнения к сообщению), что вы в итоге сделали, каковы были выводы .... однако я понимаю, что это может быть конфиденциально ...
Робин Жирар
Я хочу еще раз проголосовать, чтобы вы пропустили вопрос об определении случайной величины;)
Робин Джирард
Я вернусь, чтобы рассказать вам, каковы были результаты, но через некоторое время я буду работать над этим наряду со многими другими задачами. Не был уверен, что вы имели в виду под «передать вопрос о случайной переменной»? Есть вопрос, который вы рекомендуете мне посмотреть?
Крис Били
извините, если мне неясно, я имею в виду не то, что я предпочитаю (личное субъективное мнение) вопросы, подобные вашим, чем вопрос, который задает "что такое случайная величина" ... но я думаю, что мое удовольствие не от всех :)
Робин Жирар

Ответы:

9

Модель, которая соответствует данным, не должна быть моделью временного ряда; Я бы посоветовал немного подумать нестандартно.

Если у вас есть несколько переменных (например, возраст, пол, диета, этническая принадлежность, болезнь, лекарства), вы можете использовать их для другой модели. Может быть, наличие определенных пациентов в одной комнате является важным предиктором? Или, возможно, это связано с обслуживающим персоналом? Или рассмотрите возможность использования модели с различными вариациями временных рядов (например, VECM), если у вас есть другие переменные, которые вы можете использовать. Посмотрите на отношения между насилием между пациентами: действуют ли определенные пациенты вместе?

Модель временного ряда полезна, если время играет важную роль в поведении. Например, может быть кластер насилия. Посмотрите на литературу по кластеризации волатильности. Как предполагает @Jonas, с задержкой порядка 2, вам может потребоваться быть более внимательным в день, следующий за вспышкой насилия. Но это не поможет вам предотвратить первый день: может существовать другая информация, которую вы можете связать с анализом, чтобы на самом деле понять причину насилия, а не просто прогнозировать ее в виде временных рядов.

Наконец, в качестве технического предложения: если вы используете R для анализа, вы можете взглянуть на пакет прогноза от Роба Хиндмана (создателя этого сайта). Это имеет много очень приятных особенностей; см. статью «Автоматическое прогнозирование временных рядов: пакет прогноза для R» в журнале статистического программного обеспечения.

Шейн
источник
1
Договорились - просто выдвинуть некоторые дополнительные идеи по моделированию: логистика для прогнозирования того, какие пациенты будут иметь более 1 вспышки насилия, регрессия Пуассона (esque) для прогнозирования того, у каких пациентов будет много вспышек, многоуровневая для изучения изменений от комнаты к комнате и / или в палату ...
Мэтт Паркер
1
+1 Легко быть ослепленным наставлениями, чтобы не использовать линейные модели и т. Д. Во временных рядах из-за проблем с автокорреляцией, и попасть в ARIMA, DLM и т. Д., Когда LM, GLM и т. Д. Могут быть достаточно мощными с немного осторожности
Уэйн
6

Вы приспособили модель к различиям, что означает, что вы описываете изменение уровня насилия. Вы получаете лаг на 2 дня. Отставание указывает на память процесса. Другими словами, изменение уровня насилия сегодня зависит от изменения уровня насилия за последние два дня. В более длительных временных масштабах вклад случайных влияний становится достаточно сильным, так что четкой связи больше нет.

Автокорреляция положительна? Затем изменение уровня насилия сегодня предполагает аналогичное изменение уровня насилия за два дня. Это отрицательно? Тогда насилие может остаться выше в течение двух дней.

Конечно, вы можете захотеть контролировать смешанные эффекты. Например, после серьезного инцидента люди могут с большей вероятностью сообщать о незначительных инцидентах, но эта «сенсибилизация» исчезнет через два дня.

Jonas
источник