HMM против CRF для моделирования временных рядов данных о роботах, взаимодействующих с окружающей средой?

9

У меня есть временной ряд данных о силе роботов, взаимодействующих с объектами окружающей среды с различными текстурами. Я хотел бы разработать модели различных текстур, используя данные временных рядов для классификации текстур на гладкие, грубые, умеренные и т. Д. Категории. Для этого будет ли достаточно скрытых марковских моделей или я должен использовать условные случайные поля? Если я решу классифицировать по нескольким категориям, и различие между этими категориями будет очень тонким, в таком случае, что будет хорошим выбором? Будет ли принудительных данных достаточно, чтобы собрать всю информацию, необходимую для классификации текстур по этим категориям?

Спасибо за ваши ответы :)

Гилмор
источник

Ответы:

5

Основываясь на описании вашей проблемы, будут работать как HMM (генеративная модель), так и CRF (дискриминационная модель). Смотрите это обсуждение для более глубокого объяснения двух подходов:

В чем разница между генеративным и дискриминационным алгоритмом?

Предложение: прежде чем выбирать алгоритм, начните с тщательного изучения ваших числовых данных, с графиками MATLAB или аналогичными. Если информация является многомерной (например, значения силы от нескольких датчиков), возможно, что некоторые измерения (например, показания датчика) не содержат полезной дискриминационной информации; в этом случае сожмите данные с помощью анализа основных компонентов, чтобы иметь более компактные функции во время обучения и классификации.

Теперь по поводу вашего вопроса:

Разница в том, что HMM могут представлять каждый из ваших текстурных классов с несколькими скрытыми переменными / состояниями, тем самым фиксируя внутреннюю временную эволюцию каждого контакта. Можно сказать, что HMM лучше моделирует «низкоуровневую» (внутриклассовую) динамику ваших данных. Например, в вашем случае HMM позволит вам явно моделировать три разных этапа каждого сбора данных: (1) начало контакта между роботом и объектом; (2) стабильная часть контакта; (3) конец контакта и выпуска. Эти фазы могут иметь разные значения во времени, даже для одной и той же текстуры объекта, и имеет смысл разделить их, чтобы улучшить результаты классификации.

С другой стороны, CRF больше подходят для захвата «высокоуровневых» (межклассовых) отношений вашего распределения данных, которые иногда важны, когда пространственно-временная изменчивость высока, или когда особенности наблюдения очень похожи между два образца, принадлежащие к разным классам.

Лично я считаю, что HMM проще в использовании, и я бы начал с них, но ваш пробег может отличаться.

Если я решу классифицировать по нескольким категориям, и различие между этими категориями будет очень тонким, в таком случае, что будет хорошим выбором?

В этом случае CRF могут быть более надежным выбором (см. Выше).

Будет ли принудительных данных достаточно, чтобы собрать всю информацию, необходимую для классификации текстур по этим категориям?

Добавление визуальных функций (внешний вид объекта), особенно если они получены с помощью камер высокого разрешения, может помочь определить, имеет ли объект грубую текстуру или нет.

Джованни Сапонаро
источник
Извините за поздний ответ. Ваши комментарии были очень полезны. Я уже внедрил HMM, и они, кажется, работают хорошо. Я не преобразовывал данные в их низкоразмерное представление с использованием PCA, скорее использовал HMM, которые могут принимать непрерывные данные / распределения, чтобы избежать потери какой-либо информации. Но так как я в любом случае использую его для классификации, я думаю, что использование дискриминационных подходов может дать лучшие результаты (еще предстоит увидеть и подтвердить).
Гилмор
Рад знать, что HMM хорошо работают для моделирования ваших данных датчика силы. Мне было бы интересно узнать больше об этом.
Джованни Сапонаро