Консенсусная кластеризация с использованием множества объединений

21

Я уже публиковал этот вопрос некоторое время назад в MathOverflow , но, насколько мне известно, он все еще открыт, поэтому я публикую его здесь в надежде, что кто-то мог о нем слышать.

Постановка задачи

Пусть , Q и R - три разбиения на p непустых частей (обозначаемых через P h 's, Q i ' и R j 's) множества { 1 , 2 , , n }. Найдите две перестановки π и σ, которые минимизируют p i = 1 | P iQ π iR σ i | ,PQRpPhQiRj1,2,,nπσ

i=1p|PiQπiRσi|.

Вопросов

1) Какова сложность этой проблемы (или соответствующей проблемы решения)?

2) Если задача действительно разрешима за полиномиальное время, остается ли она верной для любого числа разбиений?k4

Предыдущая работа

Берман, DasGupta, Kao и Wang ( http://dx.doi.org/10.1016/j.ipl.2007.06.008 ) изучают аналогичную проблему для разделов, но с использованием парных Δ вместо в приведенной выше сумме. Они доказывают, что задача является MAX-SNP-трудной для k = 3 , даже когда каждая часть имеет только два элемента, путем сведения MAX-CUT на кубических графах к частному случаю их задачи, и дают ( 2 - 2 / k ) -приближение для любого k . До сих пор я не смог найти свою проблему в литературе или адаптировать их доказательства.kΔk=3(22/k)k

Легкие кейсы

Вот некоторые случаи, которые, как я обнаружил, разрешимы за полиномиальное время:

  • случай ;k=2
  • случай для любого k ;p=2k

Более того, когда , две части не равны, и все части имеют размер 2 , у нас есть нижняя граница 3 p + 1 (я не знаю, плотно ли она).k=323p+1

Энтони Лабарре
источник

Ответы:

4

Проблема NP-сложная. Доказательством является уменьшение от следующей проблемы:

GNNG

GA1A2A3GEijAiAj1,,N

n=|E(G)|+MMM=10|E(G)|p=N+1|E(G)|{1,,n}GPPii=1,,NiA1E1,2E1,3PN+1E2,3{|E(G)|+1,,|E(G)|+M}QA2A1RA3A1

3|E(G)|3N+MGNM2MPN+1QN+1RN+1|E(G)|+M2|E(G)|3NPiQjPiRkQjRkNG

Мохаммад
источник