Учитывая две поглощающие цепи Маркова, какова вероятность того, что одна из них прервется раньше другой?

9

У меня есть две разные цепи Маркова, каждая с одним поглощающим состоянием и известной стартовой позицией. Я хочу определить вероятность того, что цепь 1 достигнет поглощающего состояния за меньшее количество шагов, чем цепь 2.

Я думаю, что могу вычислить вероятность достижения поглощающего состояния в определенной цепочке после n шагов: при заданной матрице перехода вероятность поглощения после шагов равна P ^ n_ {ij}, где i - начальное состояние, а j - это поглощающее состояние.n P n i j i jPnPijnij

Я не уверен, куда идти отсюда, хотя. Аналогичные проблемы, которые я видел, включают в себя игральные кости (например, бросание суммы 7 до суммы 8), но это легче решить, потому что вероятность броска определенной суммы постоянна и не зависит от количества шагов, предпринятых до сих пор.

Джефф
источник

Ответы:

13

Запустите цепи параллельно. Определите три поглощающих состояния в полученной цепочке продуктов:

  1. Первая цепь достигает поглощающего состояния, а вторая - нет.

  2. Вторая цепь достигает поглощающего состояния, а первая - нет.

  3. Обе цепи одновременно достигают поглощающего состояния.

Предельные вероятности этих трех состояний в цепочке продуктов дают шансы на интерес.


Это решение включает в себя некоторые (простые) конструкции. Как и в вопросе, пусть быть матрица перехода для цепи P . Когда цепочка находится в состоянии i , P i j дает вероятность перехода в состояние j . Поглощающие состояния делают переход к самому себе с вероятностью 1 .P=Pij,1i,jnPiPijj1

  1. Любое состояние можно сделать поглощающим после замены строки P i = ( P i j , j = 1 , 2 , , n ) вектором индикатора ( 0 , 0 , , 0 , 1 , 0 , , 0 ) с 1 в положении я .iPi=(Pij,j=1,2,,n)(0,0,,0,1,0,,0)1i
  2. Любой набор поглощающих состояний можно объединить , создав новую цепочку с состояниями . Матрица перехода определяется какP / A { яAP/A{i|iA}{A}

    (P/A)ij={PijiA,jAkAPikiA,j=A0i=A,jA1i=j=A.

    Это равносильно суммированию столбцов соответствующих A, и замене строк, соответствующих A , одной строкой, которая выполняет переход к себе.PAA

  3. Продукт из двух цепей на состояниях S P и Q на состояниях S Q , с переходом матрицы P и Q , соответственно, представляет собой цепь Маркова на состояния S P × S Q = { ( р , д )PSPQSQPQ с переходной матрицейSP×SQ={(p,q)|pSP,qSQ}

    (PQ)(i,j),(k,l)=PikQjl.

    Фактически, цепочка продуктов управляет двумя цепочками параллельно, отдельно отслеживая, где каждая из них, и выполняет переходы независимо.


Простой пример может прояснить эти конструкции. Предположим, Полли подбрасывает монету с шансом приземления голов. Она планирует сделать это, пока не увидит головы. Состояния для процесса подбрасывания монеты: S P = { T , H }, представляющие результаты самого последнего броска: T для хвостов, H для голов. Планируя остановиться на головах, Полли применит первую конструкцию, сделав H поглощающим состоянием. Результирующая матрица переходаpSP={T,H}THH

P=(1pp01).

Он начинается в случайном состоянии заданном первым броском.(1p,p)

Со временем с Полли Куинси подбросит честную монету. Он планирует остановиться, как только увидит две головы подряд. Поэтому его цепочка Маркова должна отслеживать предыдущий результат, а также текущий результат. Существует четыре таких комбинации двух голов и двух хвостов, которые я буду сокращать , например, как « », где первая буква - это предыдущий результат, а вторая буква - текущий результат. Куинси применяет конструкцию (1), чтобы сделать ЧЧ поглощающим состоянием. После этого он понимает, что ему на самом деле не нужны четыре состояния: он может упростить свою цепочку до трех состояний: T означает, что текущий результат - это хвосты, H - текущий результат - головы, а XTHHHTHXозначает, что последние два результата были обе головы - это поглощающее состояние. Матрица перехода

Q=(1212012012001).

Цепочка продуктов работает в шести состояниях: . Матрица перехода является тензорное произведение из P и Q , и так же легко вычислена. Например, ( PQ ) ( T ,(T,T),(T,H),(T,X);(H,T),(H,H),(H,X)PQ является вероятностьчто попка делает переход отТкТи, в то же время (и независимо другдруга), Квинси делает переход отТкН. Первый имеет шанс1-ри последний шанс1 / 2. Поскольку цепочки работают независимо, эти шансы умножаются, давая(1-p) / 2. Полная матрица перехода(PQ)(T,T),(T,H)TTTH1p1/2(1p)/2

PQ=(1p21p20p2p201p201p2p20p2001p00p0001212000012012000001).

Он находится в форме блочной матрицы с блоками, соответствующими второй матрице :Q

пQзнак равно(п11Qп12Qп21Qп22Q)знак равно((1-п)QпQ0Q),

(ЧАС,*)*Икс(T,Икс)(ЧАС,Икс)(ЧАС,T)(ЧАС,ЧАС)(T,T),(T,ЧАС),(T,Икс),{(ЧАС,T),(ЧАС,ЧАС)},(ЧАС,Икс)

рзнак равно(1-п21-п20п01-п201-п2п2п2001000001000001),

(T,T),(T,ЧАС),(T,Икс),{(ЧАС,T),(ЧАС,ЧАС)},(ЧАС,Икс)μзнак равно((1-п)/2,(1-п)/2,0,п,0)

N

μрN11+4п-п2(0,0,(1-п)2,п(5-п),п(1-п)),

(T,Икс),{(ЧАС,T),(ЧАС,ЧАС)},(ЧАС,Икс)(1-п)2:п(5-п):п(1-п)

фигура

п

Whuber
источник
1
Очень аккуратный пример, спасибо за это. Я все еще прорабатываю детали, чтобы увидеть их для себя. Просто вопрос: здесь мы предположили, что два события (броски Полли и Куинси) происходили одновременно, насколько сильно это изменится, если мы сделаем их последовательными или даже выберем случайным образом каждый раз, кто бросит следующий?
user929304
1
@ user929304 Вы бы получили разные ответы, возможно, существенно. Например, предположим, что P и Q выполняют цепочку, в которой состояния разбиты на подмножества A и B, где все переходы из A переходят в B, а все из B переходят в A. Пусть P и Q оба начинаются в состояниях в A. In цепочка продуктов, они оба одновременно чередуются между А и В, но цепочки последовательного и случайного выбора нарушают этот инвариантный паттерн.
whuber