Как смоделировать смещенную монету с изменяющимся во времени смещением?

10

Модели смещенных монет обычно имеют один параметр . Один из способов оценить θ по серии тиражей - использовать предварительное бета-тестирование и вычислить апостериорное распределение с биномиальной вероятностью.θ=P(Head|θ)θ

В моих настройках из-за какого-то странного физического процесса свойства моей монеты медленно меняются, и становится функцией времени t . Мои данные представляют собой набор упорядоченных черпает ИЭ { H , T , H , H , H , T , . , , } . Я могу считать, что у меня есть только одна ничья для каждого t на сетке дискретного и регулярного времени.θt{H,T,H,H,H,T,...}t

Как бы вы смоделировали это? Я думаю о чем-то вроде фильтра Калмана, адаптированного к тому факту, что скрытая переменная равна и сохраняет биномиальную вероятность. Что я мог бы использовать для моделирования P ( θ ( t + 1 ) | θ ( t ) ), чтобы сделать вывод выводимым?θP(θ(t+1)|θ(t))

Отредактируйте следующие ответы (спасибо!) : Я хотел бы смоделировать как цепь Маркова порядка 1, как это делается в фильтрах HMM или Kalman. Единственное предположение, которое я могу сделать, это то, что θ ( t ) является гладким. Я мог бы написать P ( θ ( t + 1 ) | θ ( t ) ) = θ ( t ) + ϵ с ϵ небольшим гауссовским шумом (идея фильтра Калмана), но это нарушило бы требование, чтобы θ оставалось в [ 0θ(t)θ(t)P(θ(t+1)|θ(t))=θ(t)+ϵϵθ . Следуя идее @J Dav, я мог бы использовать функцию пробита, чтобы отобразить действительную линию на [ 0 , 1 ] , но у меня есть интуиция, что это даст неаналитическое решение. Бета-распределение со средним значением θ ( t ) и более широкой дисперсией может помочь.[0,1][0,1]θ(t)

Я задаю этот вопрос, так как у меня такое ощущение, что эта проблема настолько проста, что, должно быть, ее уже изучали раньше.

repied2
источник
Вы можете получить оценку, если у вас есть модель того, как пропорция успеха меняется со временем. Многие различные модели будут работать, и оценки могут сильно различаться в зависимости от предполагаемой модели. Я не думаю, что управляемость является практическим критерием выбора модели. Я хотел бы понять процесс и найти модель, которая демонстрирует характеристику, которая соответствует ожидаемому поведению.
Майкл Р. Черник
@MichaelChernick: Спасибо. Единственное предположение, которое я могу сделать, это то, что движется плавно и медленно. Более того, возможность отслеживания является важным критерием, поскольку я действительно хочу расширить решение для многомерного случая с нетривиальными взаимозависимостями. Идеальным решением было бы аналитическое и оперативное обновление оценок параметров при поступлении новых данных. θ
ответил2
1
Можете ли вы дать количественную оценку того, что вы подразумеваете под " движется плавно и медленно?" Целые числа являются дискретными, и есть гладкие функции, которые принимают произвольные значения на целых числах, что означает, что гладкость не дает ограничений. Некоторые понятия «медленно» до сих пор не дают никаких ограничений, в то время как другие делают. θ
Дуглас Заре
Насколько быстро «медленно», как изменение вероятности на 0,1 / единицу времени или на 0,001 или ... И как долго вы ожидаете получить последовательность? Является ли диапазон относительно узким (например, 0,2-0,4) или близок к (0,1)?
Jbowman
@DouglasZare Под «гладким» я хотел заявить, что E [θ_t + 1 | θ_t] = θ_t (или очень близко) и VAR (θ_t + 1 | θ_t) мало. θ не прыгает (иначе ничего не поделаешь).
ответил2

Ответы:

2

Я сомневаюсь, что вы можете придумать модель с аналитическим решением, но вывод по-прежнему можно сделать возможным, используя правильные инструменты, поскольку структура зависимостей вашей модели проста. Как исследователь машинного обучения, я бы предпочел использовать следующую модель, так как вывод можно сделать довольно эффективным, используя технику распространения ожиданий:

X(t)t

η(t+1)N(η(t),τ2)t0

η(t)X(t)

Y(t)N(η(t),β2)

X(t)

X(t)=1Y(t)0X(t)=0Y(t)P[X(t)=1]=Φ(η(t)/β)Φθ(t)=η(t)/β

Если вы заинтересованы в реализации алгоритма логического вывода, взгляните на эту статью . Они используют очень похожую модель, поэтому вы можете легко адаптировать алгоритм. Для понимания EP следующая страница может оказаться полезной. Если вы заинтересованы в реализации этого подхода, дайте мне знать; Я могу дать более подробный совет о том, как реализовать алгоритм вывода.

d_ijk_stra
источник
0

000

Майкл Р. Черник
источник
1
tθ(t)θ(t)
1
theta(t)
@pierre Хорошо, перед редактированием оказалось, что вы пытались оценить изменяющееся по времени p и просто предлагали HMM в качестве возможного подхода. Я не рекомендовал функциональную форму для того, как она меняется с т. Я подчеркивал, что без дополнительной информации можно построить много моделей различных типов, и мои два примера должны были показать, что без дополнительной информации выбор моделей может дать очень разные ответы. Почему вы настаиваете на HMM? Если один работал и установить данные , почему отклонять, потому что это «неаналитический.
Майкл Р. Chernick
Я полагаю, что поиск удобных решений не является способом решения практических статистических задач!
Майкл Р. Черник
1
@MichaelChernick Наконец: я хотел бы найти аналитическое решение, так как я надеюсь, что это известная проблема, и люди предложили достаточно гибкое аналитическое решение. Но я согласен с нашим предположением, что моделирование «реальной динамики» важнее, чем вычислительные затраты в целом. К сожалению, это для больших данных, и медленный алгоритм будет бесполезен :-(
repied2
0

tp

p=Φ(g(t,θ))g(t,θ)Φ

Φg()g()

Чтобы ответить на ваш переизданный вопрос:

Как вы сказали, использование пробита подразумевает только численные решения, но вместо этого вы можете использовать логистическую функцию:

P[θ(t+1)]=11+exp(θ(t)+ϵ)

logP1P=θ(t)+ϵ

θ(t+1)=at3+bt2+ct+dϵϵ

P[Coint+1=H|t]=11+exp(θ(t))

ϵt

JDav
источник
Если вы используете пробит, многовариантное расширение является простым, так как многомерный пробит может быть оценен. Зависимости будут подразумеваться ковариационной матрицей подразумеваемого многомерного нормального распределения.
JDav