Я подозреваю, что ряд наблюдаемых последовательностей представляет собой цепь Маркова ...
X=⎛⎝⎜⎜⎜⎜AB⋮BCA⋮CDA⋮ADC⋮DBA⋮AAD⋮BCA⋮E⎞⎠⎟⎟⎟⎟
Однако, как я мог проверить, что они действительно уважают свойство без памяти
P(Xi=xi|Xj=xj)?
Или хотя бы доказать, что они марковские по природе? Обратите внимание, что это эмпирически наблюдаемые последовательности. Есть предположения?
РЕДАКТИРОВАТЬ
Просто добавьте, цель состоит в том, чтобы сравнить предсказанный набор последовательности из наблюдаемых. Поэтому мы будем благодарны за комментарии о том, как их лучше всего сравнить.
Матрица переходов первого порядкаMij=xij∑mxik
где m = A..E состояния
M=⎛⎝⎜⎜⎜⎜⎜⎜0.18340.46970.18270.23780.24580.30770.11360.24040.18180.17880.07690.00760.22120.06290.11730.14790.25000.19230.33570.17880.28400.15910.16350.18180.2793⎞⎠⎟⎟⎟⎟⎟⎟
Собственные значения M
E=⎛⎝⎜⎜⎜⎜⎜⎜1.000000000−0.2283000000.1344000000.1136−0.0430i000000.1136+0.0430i⎞⎠⎟⎟⎟⎟⎟⎟
Собственные векторы M
V=⎛⎝⎜⎜⎜⎜⎜⎜0.44720.44720.44720.44720.4472−0.58520.7838−0.2006−0.00100.0540−0.4219−0.42110.37250.70890.0589−0.2343−0.0421i−0.4479−0.2723i0.63230.2123−0.0908i0.2546+0.3881i−0.2343+0.0421i−0.4479+0.2723i0.63230.2123+0.0908i0.2546−0.3881i⎞⎠⎟⎟⎟⎟⎟⎟
Ответы:
Интересно, даст ли следующее действительный тест Пирсона для пропорций следующим образом.χ2
Это заманчиво для меня, чтобы думать, что каждый , так что общее количество . Однако я не совсем уверен в этом и буду признателен за ваши мысли по этому поводу. Я также не уверен в том, нужно ли быть параноиком в отношении независимости, и хотел бы разбить выборку пополам, чтобы оценить и . Т ~ χ - 12 р ° рTU∼χ23 T∼χ212 p^ p¯
источник
Свойство Маркова может быть трудно проверить напрямую. Но этого может быть достаточно для подгонки модели, которая предполагает свойство Маркова, а затем для проверки правильности модели. Может оказаться, что подобранная модель является хорошим приближением, которое полезно для вас на практике, и вам не нужно беспокоиться о том, действительно ли свойство Маркова действительно выполняется или нет.
Параллель можно провести к линейной регрессии. Обычная практика состоит не в том, чтобы проверить, имеет ли место линейность, а в том, является ли линейная модель полезным приближением.
источник
Чтобы конкретизировать предложение предыдущего ответа, вы сначала хотите оценить вероятности Маркова - предполагая, что это Марков. Смотрите ответ здесь Оценка вероятностей цепей Маркова
Вы должны получить матрицу 4 х 4 на основе доли переходов из состояния А к А, от А до В и т.д. Вызывайте эту матрицу . Тогда M 2 должна быть двухступенчатой матрицей перехода: от A до A за 2 шага и так далее. Затем вы можете проверить, похожа ли ваша наблюдаемая двухступенчатая матрица перехода на M 2.M M2 M2 .
Поскольку у вас много данных о количестве состояний, вы можете оценить половине данных и проверить M 2M M2 используя другую половину - вы проверяете наблюдаемые частоты по теоретическим вероятностям полинома. Это должно дать вам представление о том, как далеко вы находитесь.
Другой возможностью было бы посмотреть, соответствуют ли пропорции основного состояния: пропорция времени, проведенного в A, времени, проведенного в B, соответствует собственному вектору собственного значения единицы M. Если ваша серия достигла какого-то устойчивого состояния, доля времени в каждом государство должно стремиться к этому пределу.
источник
Помимо марковского свойства (MP), еще одним свойством является временная однородность (TH): может быть марковским, но с переходной матрицей P ( t ), зависящей от времени t . Например, это может зависеть от дня недели в момент времени t, если наблюдения являются ежедневными, и тогда зависимость X t от X t - 7, обусловленная X t - 1, может быть диагностирована, если TH неправильно принят.Xt P(t) t t Xt Xt−7 Xt−1
Предполагая, что TH имеет место, возможной проверкой MP является проверка того, что не зависит от X t - 2, условно для X t - 1 , как предложили Майкл Черник и StasK. Это можно сделать с помощью теста на непредвиденные обстоятельства. Мы можем построить n таблиц сопряженности для X t и X t - 2, условных на { X t - 1 = x j } для n возможных значений x jXt Xt−2 Xt−1 n Xt Xt−2 {Xt−1=xj} n xj и проверить на независимость. Это также можно сделать, используя
с ℓ > 1 вместо X t - 2Xt−ℓ ℓ>1 Xt−2 .
В R, Таблица или массивы легко получены благодаря фактору объекту и функциямp(Xt|Xt−1=xj,Xt−2=xi) i j
apply
,sweep
. Идея выше также может быть использована графически. Пакеты ggplot2 или решетка легко предоставляют условные графики для сравнения условных распределений . Например, установка i в качестве индекса строки и индекса столбца в решетке должна в MP приводить к аналогичным распределениям внутри столбца.Глава 5 книги Статистический анализ случайных процессов во времени Дж. К. Линдси содержит другие идеи для проверки предположений.
]
источник
Я думаю, что placida и mpiktas дали очень продуманные и превосходные подходы.
Тогда статистикой теста будет разница между этими оценочными пропорциями. Сложность стандартного сравнения последовательностей Бернулли заключается в том, что они коррелированы. Но в этом случае вы можете выполнить тест начальной загрузки биномиальных пропорций.
источник
источник