Нахождение свидетеля у Минковского суммы целых чисел

16

Пусть A и B - подмножества {0,,n} . Нам интересно найти сумму Минковского A+B={a+b | aA,bB} .

χX:{0,,2n}{0,1} является характеристической функциейX если

χX(x)={1 if xX0 otherwise

Пусть - дискретная свертка χ A и χ B , тогда x A + B тогда и только тогда, когда f ( x ) > 0 . Следовательно, A + B может быть вычислено за O ( n log n ) с помощью дискретной свертки через FFT.fχAχBxA+Bf(x)>0A+BO(nlogn)

Иногда важно выяснить фактическую пару и b B, которая суммируется с x . называется свидетельство о х , если существуют б B такое , что + Ь = х . Функция w : A + B A называется функцией-свидетелем, если w ( x ) является свидетелем x .aAbBxaAxbBa+b=xw:A+BAw(x)x

Можно ли вычислить функцию-свидетель за ?O(nlogn)

Чао Сюй
источник
3
не особенно сложно. O(npolylogn)
Сариэль Хар-Пелед
2
Вы можете использовать бинарный поиск. например, разбить на два набора примерно одинакового размера A L , A R и вычислить A L + B и A R + B ; проверьте, в каком из этих х есть; и рекурсировать. Это даст вам что-то вроде O ( n lg 2 n ) . AAL,ARAL+BAR+BxO(nlg2n)
DW
@DW Это может только найти свидетельство для одного , но мы хотим , чтобы свидетель для каждого элемента A + B . (моя формулировка кажется неясной, поэтому я просто обновил вопрос)xA+B
Чао Сюй
Но вас интересует решение O (n polylog n)?
Сариэль Хар-Пелед
@ SarielHar-Peled да, меня также интересует детерминированный алгоритм . O(npolylogn)
Чао Сюй

Ответы:

11

Здесь я объясняю, как получить рандомизированное время выполнения. Нам нужна последовательность наблюдений:O(npolylogn)

  1. Свидетель из величины представляет собой пару чисел ( , Ь ) × B таким образом, что + Ь = v . Пусть P A ( x ) = i A x i и P B ( x ) определены аналогично. Заметим, что коэффициент x v в P A ( x ) P B ( xv(a,b)A×Ba+b=vPA(x)=iAxiPB(x)xv - число свидетелей для значения v .PA(x)PB(x)v

  2. Предположим, что имеет единственный свидетель ( a , b ) A × B , и рассмотрим многочлен Q A ( x ) = i A i x i . Ясно, что коэффициент x v в Q A ( x ) P B ( x ) равен a , и теперь мы знаем пару ( a , v - a )v(a,b)A×BQA(x)=iAixixvQA(x)PB(x)a(a,va) и мы сделали.

  3. Итак, мы закончили с делом, что есть один свидетель. Итак, рассмотрим случай, когда имеет k свидетелей ( a 1 , b 1 ) , , ( a k , b k ) . Пусть i ( k ) = lg vk(a1,b1),,(ak,bk). Заметим, что2i(k)-1i(k)=lgk . Далее, пустьRj=(Aj,Bj), дляj=1,,m, дляm=O(logn)случайные выборки, так что каждый элемент изAвыбирается в Aiс вероятностьюp=1/2 я ( к ) . Вероятность того, чтоV2i(k)1k2i(k)Rj=(Aj,Bj)j=1,,mm=O(logn)AAip=1/2i(k)vимеет одного свидетеля в является α = ( kRj, поскольку свидетелем являются непересекающиеся пары чисел (поскольку сумма каждой пары равнаv). Нетрудно проверить, чтоαявляется константой в(0,1)независимо от значенияk. Таким образом, с высокой вероятностью должно быть, чтоvимеет одного свидетеля в одном из образцовR1,,Rm. Таким образом, путем вычисления двух полиномов, связанных с таким образцом, как описано выше, вα=(k1)p2(1p2)k1vα(0,1)kvR1,,RmO(nlogn) time (per sample), using FFT, we can decide this in constant time.

  4. We are almost done. Compute the above random samples for resolutions i=1,,lgn. For each such resolution compute the random samples and associated polynomials. Also, compute the associated polynomial for A and B. This preprocessing naively takes O(nlog3n), but I suspect that being slightly more careful a logn factor should be removable.

  5. The algorithm: For every value v, compute how many witness, say k, it has in constant time, by consulting the polynomial QA(x)PB(x). Next, go to the relevant data-structure for i(k). Then, it finds the random sample that has it as a single witness, and it extract the pair that is this witness in constant time.

  6. Strangely enough, the preprocessing time is O(nlog3n), but the expected time to find the witness themselves take only O(n) time, since one can stop the search as soon as one find a witness. This suggests that this algorithm should be improveable. In particular, for i(k)lgn, the polynomials generated are very sparse, and one should be able to do much faster FFT.

Sariel Har-Peled
источник
12

Ok, I've been holding off since really Sariel should get credit for an answer, but I'm tired of waiting, so here is my cut at a near-linear randomized algorithm.

  • By choosing samples of n(1ϵ)i points, i=0,1,, you can get a logarithmic number of subproblems such that each sum from the original problem has constant probability of being represented uniquely in one of the subproblems (the one where the sampling cuts down the expected number of representations to near 1).
  • By repeating the sampling process a logarithmic number of times you can get all sums to have unique representations with high probability.
  • If you have a partition of A and B into two subsets, then by multiplying the numbers by four, adding 2 to the numbers in one of the subsets in A, and adding 1 to the numbers in one of the subsets in B, you can read off from the mod-4 values of the achievable sums which of the two subsets their summands come from.
  • By repeating the partition process a logarithmic number of times, using each bit position of the binary representations of the values or indices in the subproblems to select the partitions in each step, you can uniquely identify the summands of every uniquely-represented sum.

This blows up the running time by three logarithmic factors; probably that can be reduced.

David Eppstein
источник
3
Ha ha ;). I was in the middle of writing it, and then went to lunch...
Sariel Har-Peled
5

This answer gives a determinstic O(n polylogn) algorithm.

It appears that Sariel and David's algorithm can be derandomized through an approach similar to this paper. [2] While going through the process I found there is a more general problem that implies this result.

The k-reconstruction problem

There are hidden sets S1,,Sn{1,,m}, we have two oracles Size and Sum that take a query set Q.

  1. Size(Q) returns (|S1Q|,|S2Q|,,|SnQ|), the size of each intersection.
  2. Sum(Q) returns (sS1Qs,sS2Qs,,sSnQs), the sum of elements in each intersection.

The k-reconstruction problem asks one to find n subsets S1,,Sn such that SiSi and |Si|=min(k,|Si|) for all i.

Let f be the running time of calling the oracles, and assume f=Ω(m+n), then one can find the sets in deterministic O(fklogn polylog(m)) time. [1]

Now we can reduce the finding witness problem to 1-reconstruction problem. Here S1,,S2n{1,,2n} where Si={a|a+b=i,aA,bB}.

Define the polynomials χQ(x)=iQxi, IQ(x)=iQixi

The coefficient for xi in χQχB(x) is |SiQ| and in IQχB(x) is sSiQs. Hence the oracles take O(nlogn) time per call.

This gives us an O(n polylog(n)) time deterministic algorithm.

[1] Yonatan Aumann, Moshe Lewenstein, Noa Lewenstein, Dekel Tsur: Finding witnesses by peeling. ACM Transactions on Algorithms 7(2): 24 (2011)

[2] Noga Alon, Moni Naor: Derandomization, witnesses for Boolean matrix multiplication and construction of perfect hash functions. Algorithmica 16(4-5) (1996)

Chao Xu
источник