Алгоритм Twitter основан на
Рознер, Б. (май 1983 г.), «Процентные баллы для обобщенной процедуры многократного выброса ОУР», Technometrics, 25 (2), с. 165-172
Я уверен, что было много методов и достижений с 1983 года! Я проверил свои внутренние данные, и обнаружение аномалий в Твиттере не выявляет явных выбросов. Я бы также использовал другие подходы, чтобы проверить выбросы во временных рядах. Лучшее, с чем я столкнулся, - это процедура обнаружения выбросов Цая, которая реализована в программном обеспечении SAS / SPSS / Autobox и SCA. Все из которых являются коммерческими системами. Есть также
пакет tsoutliers , который хорош, но нуждается в спецификации arima
модели для эффективной работы. У меня были проблемы с его настройками по умолчанию в auto.arima
отношении оптимизации и выбора модели.
Статья Цая является плодотворной работой по обнаружению выбросов во временных рядах. Ведущий журнал по исследованиям в области прогнозирования Международный журнал по прогнозированию упомянул, что статья Цая является одной из наиболее цитируемых работ и наиболее влиятельных статей в статье, указанной выше (см. Также ниже). Распространение этой важной работы и других алгоритмов обнаружения выбросов в программном обеспечении для прогнозирования (особенно в программном обеспечении с открытым исходным кодом) является редкостью.
Я сталкивался с несколькими источниками, которые могут вам помочь, но они не будут такими же простыми и удобными, как запуск сценария R для ваших данных: - Numenta имеет открытую версию своей платформы NuPIC, которая используется для многих вещей, включая обнаружение аномалий , - Проект Атласа от Netflix скоро выпустит инструмент для обнаружения выбросов / аномалий с открытым исходным кодом. - Prelert имеет механизм обнаружения аномалий, который поставляется как серверное приложение. Их пробная версия предлагает ограниченное использование, которое может удовлетворить ваши потребности.
В качестве альтернативы моя компания, Insignum , имеет продукт в бета-версии, который принимает данные временных рядов и обнаруживает аномалии полностью автоматизированным способом, и вы просто получаете оповещения по электронной почте при обнаружении аномалий. Обратитесь в Twitter или Linkedin, и я буду рад рассказать вам больше.
источник
Autobox (моя компания) обеспечивает обнаружение выбросов. Алгоритм Twitter получает большие выбросы, но пропускает меньшие по сравнению с Autobox .
Запуск занимает много времени, но результаты лучше находят меньшие выбросы, а также изменения в сезонности, которые также являются выбросами. Ниже приведена модель, позволяющая найти 79 выбросов с использованием первых 8 560 наблюдений из 14 398 исходных наблюдений. В стандартном варианте максимум составляет 10 000 наблюдений, но его можно изменить для большего, но нет никакой реальной причины иметь столько данных, если вы хотите идентифицировать и реагировать на выбросы.
На нас повлияла работа, проделанная Цаем по выбросам, изменениям уровня и изменению дисперсии, и работа Чоу по изменению параметров, а также наша собственная работа по выявлению изменений в сезонности,
Если вы загрузите 30-дневную пробную версию и загрузите данные примера Twitter, укажите частоту 60 и сохраните 3 файла триггера в папке установки (noparcon.afs, novarcon.afs, notrend.afs) и создадите файл с именем stepupde. с 100.
источник