Я пытаюсь научиться использовать случайные поля Маркова для сегментирования областей на изображении. Я не понимаю некоторые параметры в MRF или почему максимизация ожидания, которую я выполняю, иногда не сходится к решению.
Исходя из теоремы Байеса, я имею , где y - значение серой шкалы пикселя, а x - метка класса. Я решил использовать гауссово распределение для p ( y | x ) , в то время как p ( x ) моделируется с использованием MRF.
Я использую потенциальную функцию для MRF, которая имеет как парные потенциалы клика, так и потенциальное значение для метки класса классифицируемого пикселя. Значение потенциала одного пикселя - это некоторая постоянная которая зависит от метки класса x . Парные потенциальные функции оцениваются для 4-соединенных соседей и возвращают положительное значение β, если сосед имеет ту же метку класса, что и этот пиксель, и - β, если метки отличаются.
В момент максимизации ожидания, где я должен найти значения и β, которые максимизируют ожидаемое значение логарифмической вероятности, я использовал метод численной оптимизации (пробный градиент сопряжения, BFGS, метод Пауэлла), но всегда обнаружите, что значение β станет отрицательным, αs резко возрастет, и через одну или две итерации все изображение будет присвоено только одной метке (фон: присвоение меток класса с учетом параметров MRF было выполнено с использованием ICM). Если бы я удалил альфы, то есть только используя парные клик-потенциалы, то максимизация ожидания работала бы просто отлично.
Пожалуйста, объясните, какова цель альф для каждого класса? Я думал, что они будут связаны с количеством этого класса, который присутствует на изображении, но это не так. Как только я получил MRF, работающий только с парными потенциалами, я сравнил его с прямой моделью гауссовой смеси и обнаружил, что они дают почти идентичные результаты. Я ожидал, что парные потенциалы немного сгладят классы, но этого не произошло. Пожалуйста, сообщите, где я ошибся.
Ответы:
диагностика
Это звучит как проблема инициализации.
Используемая вами модель MRF не является выпуклой и поэтому имеет несколько локальных минимумов. Насколько я знаю, все существующие методы оптимизации чувствительны к инициализации, а это означает, что качество конечного решения сильно зависит от того, откуда вы начинаете процедуру оптимизации.
Предлагаемое решение
Я предлагаю попробовать разные стратегии для инициализации модели. Например, одна стратегия, которая приходит мне в голову, заключается в следующем:
Предлагаемая инициализация ни в коем случае не является лучшим способом инициализации вашей оптимизации, а скорее всего лишь одним из возможных вариантов.
источник