Статистическое расстояние между униформой и смещенной монетой

9

Пусть будет равномерным распределением по битам, и пусть будет распределением по битам, где биты независимы, и каждый бит равен с вероятностью . Правда ли, что статистическое расстояние между и равно , когда ?UnDn11/2ϵDUΩ(ϵn)n1/ϵ2

Manu
источник
2
Да. Статистическое расстояние между и составляет не менее , то есть ; см., например, ответ Матуса здесь: cstheory.stackexchange.com/questions/14471/…UVPrU(xi>n/2)PrD(xi>n/2)Ω(εn)
Юрий
2
Спасибо. Возможно, объясните, как получить это из того, что Матус написал в ответе, который я могу принять?
Ману
1
Что касается ответа Матуса, вы можете добиться большего успеха, чем неравенство Слуда; см. (2.13,2.14) в arxiv.org/abs/1606.08920
Aryeh

Ответы:

7

Обозначим случайные биты через . По определению, статистическое расстояние между и составляет не менее для каждого t . Мы выбираем t = n / 2 + \ sqrt {n} .x1,,xnUDPrU(xit)PrD(xit)tt=n/2+n

Обратите внимание, что для некоторой абсолютной константы . Если , то статистическое расстояние составляет не менее , и мы закончили. Поэтому ниже мы предполагаем, что .PrU(xit)c1c1>0PrD(xit)c1/2c1/2PrD(xit)c1/2

Пусть для случайных переменных Бернулли с . Наша цель - доказать, что . По теореме о среднем значении для некоторого . Теперь мы докажем, что ; это будет означать, что требуемое статистическое расстояние составляет не менее , как требуется.f(s)=Pr(xit)x1,,xnPr(xi=1)=1/2sf(0)f(ε)=Ω(εn)

е(0)-е(ε)знак равно-εе'(ξ),
ξ(0,ε)-е'(ξ)Ω(N)Ω(Nε)

Напишите, и Обратите внимание, что Таким образом,

е(ξ)знак равноΣКT(NК)(12-ξ)К(12+ξ)N-К,
f(ξ)=kt(nk)(k(12ξ)k1(12+ξ)nk+(nk)(12ξ)k(12+ξ)nk1)=kt(nk)(12ξ)k(12+ξ)nkk/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ).
k/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ)=(2kn)/2+nξ(1/2-ξ)(1/2+ξ)2(2T-N)знак равно4N,
-е'(ξ)4NΣКT(NК)(12-ξ)К(12+ξ)N-Кзнак равно4Nе(ξ)4Nе(ε)4N(с1/2),
Здесь мы использовали предположение, что . Мы показали, что .е(ε)знак равноPrD(Икс1++ИксNT)с1/2-е'(ξ)знак равноΩ(N)
Юрий
источник
5

Несколько более элементарное и немного грязное доказательство (или, по крайней мере, мне так кажется).

Для удобства напишите с в предположении.εзнак равноγNγ[0,1)

Мы явно опускаем нижнюю границу выражения : dTV(P,U)

2dTV(P,U)=x{0,1}n|(12+γn)|x|(12γn)n|x|12n|=12nk=0n(nk)|(1+2γn)k(12γn)nk1|12nk=n2+nn2+2n(nk)|(1+2γn)k(12γn)nk1|Cnk=n2+nn2+2n|(1+2γn)k(12γn)nk1|
где - абсолютная константа. Мы понижаем границу каждого слагаемого отдельно: фиксируем и пишем , так что каждое слагаемое снизу ограничено величиной, сходящейся (когда ) вC>0k=kn2[n,2n]
(1+2γn)k(12γn)nk=(14γ2n)n/2(1+2γn12γn)(14γ2n)n/2(1+2γn12γn)nne4γ2γ2
ne4γ2γ21>4γ2γ2>2γ ; подразумевая, что каждый является . Подводя итог, это приводит к как заявлено.Ω(γ)
2dTV(P,U)Cnk=n2+nn2+2nΩ(γ)=Ω(γ)=Ω(εn)
Климент С.
источник
(Использование Hellinger в качестве прокси из-за его хороших свойств по сравнению с распределением продуктов заманчиво и будет гораздо быстрее, но в конечном нижнем пределе будет потеря на квадратичный коэффициент.)
Clement C.
1
Ницца! Мне нравится элементарный подход. Мы должны быть в состоянии сделать его не асимптотическим в тоже .... одним из способов является использование , затем используйте хорошее неравенство . Немного грязнее n(1+z1z)n(1+2z)n1+weww2/2
Усул