Эндрю Мур ( Andrew Moore) начал работать над учебными пособиями по сбору статистических данных (настоятельно рекомендуется всем, кто впервые пойдет в эту область). Я начал с чтения этого чрезвычайно интересного PDF-документа под названием «Вводный обзор алгоритмов обнаружения аномалий на основе временных рядов», в котором Мур отслеживает многие из методов, использованных при создании алгоритма для обнаружения вспышек заболеваний. В середине слайдов на странице 27 он перечисляет ряд других «современных методов», используемых для обнаружения вспышек. Первый из перечисленных вейвлетов . Wikipeida описывает вейвлет как
Волнообразное колебание с амплитудой, которая начинается с нуля, увеличивается, а затем уменьшается до нуля. Обычно это можно представить как «короткое колебание»
но не описывает их применение к статистике, и мои поиски в Google дают весьма академические статьи, в которых предполагается, что вейвлеты связаны со статистикой или полными книгами по этому вопросу.
Я хотел бы получить общее представление о том, как вейвлеты применяются для обнаружения аномалий временных рядов, во многом так, как Мур иллюстрирует другие методы в своем уроке. Может кто-нибудь дать объяснение, как работают методы обнаружения с использованием вейвлетов, или ссылку на понятную статью по этому вопросу?
источник
Наиболее часто используемые и реализованные дискретные вейвлет-базисные функции (в отличие от CWT, описанного в ответе Робина) имеют два приятных свойства, которые делают их полезными для обнаружения аномалий:
На практике это означает, что ваше дискретное вейвлет-разложение рассматривает локальные изменения сигнала в различных масштабах и полосах частот. Если у вас есть (например) высокочастотный шум большой величины, наложенный на функцию, которая отображает сдвиг малой величины в течение более длительного периода, вейвлет-преобразование эффективно разделит эти две шкалы и позволит вам увидеть смещение базовой линии, что многие другие техника будет отсутствовать; изменение в этом исходном состоянии может указывать на вспышку заболевания или другое изменение интереса. Во многих отношениях вы можете относиться к самой декомпозиции как к сглаживающему (и была проделана большая работа по эффективной усадке для вейвлет-коэффициентов при непараметрической оценке, см., Например, почти что-нибудь о вейвлетах от Donoho). В отличие от чисто частотных методов, компактная поддержка означает, что они способны обрабатывать нестационарные данные. В отличие от чисто временных методов, они допускают некоторую частотную фильтрацию.
С практической точки зрения, чтобы обнаружить аномалии или точки изменения, вы бы применили к данным дискретное вейвлет-преобразование (возможно, вариант, известный как «Максимальное перекрытие DWT» или «Смещение-инвариант DWT», в зависимости от того, кого вы читаете), и посмотрите на низкочастотных наборах коэффициентов, чтобы увидеть, есть ли у вас значительные сдвиги в базовой линии. Это покажет вам, когда долгосрочные изменения происходят под любым ежедневным шумом. Персиваль и Уолден (см. Ссылки ниже) получают несколько тестов для статистически значимых коэффициентов, которые вы можете использовать, чтобы увидеть, является ли такой сдвиг значительным или нет.
Отличная справочная работа для дискретных вейвлетов - Персиваль и Уолден, «Вейвлет-методы для анализа временных рядов». Хорошей вводной работой является «Введение в вейвлеты и вейвлет-преобразования, учебник для начинающих» Бурруса, Гопинатха и Го. Если вы пришли из инженерного образования, то «Элементы вейвлетов для инженеров и ученых» - хорошее введение с точки зрения обработки сигналов.
(Отредактировано, чтобы включить комментарии Робина)
источник