Как ученые придумали правильные параметры и топологию скрытой модели Маркова для использования?

10

Я понимаю, как скрытая марковская модель используется в геномных последовательностях, таких как поиск гена. Но я не понимаю, как придумать конкретную марковскую модель. Я имею в виду, сколько состояний должна иметь модель? Сколько возможных переходов? Должна ли модель иметь петлю?

Как они узнали бы, что их модель оптимальна?

Представляют ли они, скажем, 10 разных моделей, сравнивают эти 10 моделей и публикуют лучшие?

Привет мир
источник

Ответы:

6

Я знаком с тремя основными подходами:

  1. Априори. Вы можете знать, что есть четыре пары оснований для выбора, и поэтому HMM может иметь четыре состояния. Или вы, возможно, знаете, что в английском языке есть 44 фонемы, и поэтому в модели распознавания голоса есть 44 состояния для скрытого слоя фонем.

  2. Предварительный расчет. Число состояний часто можно оценить заранее, возможно, путем простой кластеризации по наблюдаемым признакам HMM. Если матрица перехода НММ является треугольной (что часто бывает при прогнозировании сбоев), число состояний определяет форму распределения общего времени от начального состояния до конечного состояния.

  3. Оптимизация. Как вы предлагаете, либо многие модели созданы и подходят, и лучшая модель выбрана. Можно также адаптировать методологию, которая учит HMM, чтобы позволить модели добавлять или отбрасывать состояния по мере необходимости.

Мэтью Грейвс
источник
1

Еще один подход - выборка из моделей со счетным бесконечным числом состояний. Тогда ответ на вопрос «сколько» будет получен путем усреднения по сэмплерам.

http://mlg.eng.cam.ac.uk/zoubin/papers/ihmm.pdf

гипотезы
источник