Недавно я узнал о гипотезе Жадности о самой короткой проблеме суперструн .
В этой задаче нам дан набор строк и мы хотим найти самую короткую суперструну то есть такую, чтобы каждая как подстрока .
Эта задача является NP-трудной, и после длинной серии работ наиболее известный алгоритм приближения для этой задачи имеет отношение [Paluch '14].
На практике биологи используют следующий алгоритм Жадности:
На каждом шаге объединяйте две строки, которые имеют максимальное перекрытие по всем парам (максимальный суффикс, который является префиксом другой строки), и повторяйте для этого нового экземпляра, пока не останется только одна строка (которая является суперструной всех входных строк). )
Нижнюю границу в отношении аппроксимации этого алгоритма жадности можно получить из входных данных .
Интересно, что это было предположено, что это худший пример, то есть, что Жадность достигает аппроксимации для самой короткой проблемы суперструн. Я был очень удивлен, увидев, что такой естественный и простой алгоритм так сложно анализировать.
Есть ли интуиция, факты, наблюдения, примеры, которые указывают на то, почему этот вопрос так сложен?
Ответы:
Позвольте мне сначала попытаться обобщить то, что известно о гипотезе жадности.
Я думаю, что одной из причин, почему трудно доказать гипотезу Жадности, может быть следующее. Большинство подходов к доказательству гарантий аппроксимации алгоритма Жадности анализируют граф перекрытия (или, что то же самое, граф префикса) входного набора строк. Нам известны только некоторые свойства этих графов (такие как неравенства Монжа и Тройного), но эти свойства доказуемо недостаточны для доказательства гипотезы Жадности ( Вейнард, Шнитгер ; Лаубе, Вейнард ).
источник