Я читаю байесовскую онлайн-статью об обнаружении точек смены Адамса и Маккея ( ссылка ).
Авторы начинают с написания предельного распределительного предсказания: где
- т - наблюдение в момент времени ;
- т обозначает набор наблюдений до момента времени ;
- - текущая длина цикла (время с момента последнего изменения может быть 0); а также
- - это набор наблюдений, связанных с прогоном .
Eq. 1 является формально правильным (см. Ответ ниже @JuhoKokkala), но я понимаю, что если вы действительно хотите сделать прогноз о вам нужно расширить его следующим образом:
Мое рассуждение состоит в том, что вполне может быть точка изменения в (будущем) времени , но апостериорный охватывает только до .P ( r t | x 1 : t ) t
Дело в том, что авторы в статье делают нас из уравнения. 1 как есть (см. Уравнения 3 и 11 в статье), а не 1b. Таким образом, они, по-видимому, игнорируют возможность изменения точки в момент времени при прогнозировании из данных, доступных в момент времени . В начале раздела 2 они говорят en passantх т + 1 т
Мы предполагаем, что мы можем вычислить прогнозирующее распределение [для ] при условии заданной длины . г т
что, возможно, в этом и заключается хитрость. Но в целом, это прогнозное распределение должно выглядеть примерно как 1b; что не то, что они делают (уравнение 11).
Так что я не уверен, что понимаю, что происходит. Возможно, что-то смешное происходит с обозначениями.
Ссылка
- Adams, RP & MacKay, DJ (2007). Байесовское обнаружение онлайн-изменений. Препринт arXiv arXiv: 0710.3742.
источник
Ответы:
Оба (1) и (1b) являются правильными. ОП имеет право на то, что (в этой модели) может быть точка изменения в момент времени , и зависит от того, существует ли точка изменения. Это не влечет за собой никаких проблем с (1), поскольку возможные значения полностью «покрыты» . означает условное распределение обусловливающие . Это условное распределение усредняется по «всему остальному», включая , условно по . Также как можно написать, скажем,x t + 1 r t + 1 P ( x t + 1t+1 xt+1 rt+1 P(xt+1∣rt,x1:t) P(xt+1|rt,x1:t) xt+1 (rt,x1:t) rt+1 (rt,x1:t) P(xt+1000|xt) , что будет учитывать все возможные конфигурации точек изменения, а также значения s, возникающие между и .xi t t+1000
В остальном я сначала получаю (1), а затем (1b) на основе (1).
Вывод (1)
Для любых случайных величин имеем пока является дискретным (в противном случае сумма должна быть заменена интегралом). Применяя это к :A,B,C
Вывод (1b)
Рассмотрим разложение на возможные значения :P(xt+1∣rt,x(r)t) rt+1
Поскольку предполагается *, что возникновение точки изменения в (между и ) не зависит от истории , мы имеем . Кроме того, поскольку определяет, принадлежит ли к тому же , что и , мы имеем . Подставляя эти два упрощения в приведенную выше факторизацию, мы получаемt+1 xt xt+1 x P(rt+1∣rt,x(r)t)=P(rt+1∣rt) rt+1 xt+1 xt P(xt+1∣rt+1,rt,x(r)t)=P(xt+1∣rt+1,x(r)t) P ( x t + 1 ∣ x 1
* Замечание об условных предположениях независимости модели
Основываясь на быстром просмотре статьи, я лично хотел бы, чтобы свойства условной независимости были где-то более явно указаны, но я предполагаю, что предполагается, что марковское, а : s, связанные с различными прогонами, независимы (учитывая прогоны).хr x
источник