Какое наилучшее приближение для большинства голосов?

18

Операция с большинством голосов встречается довольно часто в отказоустойчивом (и, без сомнения, в других местах), где функция выводит бит, равный тому, какое значение всегда появляется в значении входных битов. Для простоты предположим, что всякий раз, когда вход содержит одинаковое количество битов в состоянии 0 и состоянии 1, он выводит 0.

Это может быть обобщено на точки, где имеется более 2 возможностей для каждого входа, возвращая значение, которое чаще всего встречается на входе, а в случае привязки - наиболее частое значение, которое появляется первым лексикографически. Давайте назовем эту функцию «множественным голосованием».

Я заинтересован в выводе такой функции, когда каждый вход имеет фиксированное распределение вероятностей (и распределение одинаково для каждого входа на входе). Конкретно меня волнует следующий вопрос.

Принимая во внимание множество , если множество независимо случайная выборка N раза, с вероятностью р я выбор я т ч элемента S каждый раз при фиксированном выборе V какова вероятность того, что множество голоса из этих выходов S V ?S={S1,S2,...,Sn}NpiithSvSv

Теперь прямо вычислить точный ответ на поставленный выше вопрос как сумму по полиномиальным распределениям. Тем не менее, для моих целей, это не идеально, и закрытое для приближения было бы лучше. Итак, мой вопрос:

Какое приближение замкнутой формы к указанной вероятности имеет самую тесную границу на максимальном расстоянии от точного значения?

Джо Фитцсимонс
источник
Я не знаю, но я бы предложил поисковую фразу «консенсус теории управления» или «проблема консенсуса теории управления». Это проблема, отличная от консенсусной задачи распределенных вычислений, и может быть то, что вам нужно.
Аарон Стерлинг
Вы ищете приближение, которое хорошо работает, когда N больше по сравнению с n? Если это так, правило разрыва связи не должно иметь значения.
Цуеши Ито
@TsuyoshiIto: Да, и действительно, это правило не имеет значения, но я хотел убедиться, что вопрос поставлен правильно. Меня не волнует, как нарушаются связи, так как эту несдержанность легко связать.
Джо Фитцзимонс
1
Ну, вот обратная сторона оценки огибающей ... Пусть будет количеством раз, когда вы выбираете множество S i . Это биноминальная переменная. Притворись, что они независимы. Теперь, для фиксированного значения Y v , вы можете вычислить вероятность получения этого значения Y v , и для этого значения вычислите вероятность того, что оно выиграет над всеми другими переменными. Это должно дать довольно хорошие границы вероятности. Они, конечно, не самые строгие - чем больше зависимости вы готовы принять во внимание, тем более точной будет ваша оценка, но чем больше вычислений вам придется делать. YiSiYvYv
Сариэль Хар-Пелед

Ответы:

1

Если для всех i v , тоpv>piiv

Pr[outcome is different from v]minT(Pr[B(N,pv)T]+Pr[ivB(N,pi)T]),

где - биномиальное распределение, а T - произвольный порог. Подставляя T = N ( p v + max i v p v ) / 2 и используя границы Чернова, можно оценить верхнюю вероятность как e - Ω ( N ) .B(n,p)TT=N(pv+maxivpv)/2eΩ(N)

Конечно, если pv не является максимальным, то вы получите противоположную картину. С подавляющей вероятностью не является результатом.v

ilyaraz
источник
1
Спасибо, что подумали о проблеме, но это не то, что я ищу. Это не закрытая форма. Мне нужно было бы суммировать по неограниченному числу экспонент. Я уже знаю, как написать точное решение, и я знаю много приближений для отдельных терминов, но это не то, что я хочу. Я ищу приближенную форму решения, а не отдельные термины. Мне также нужна достойная оценка ошибки.
Джо Фитцзимонс
1
Вы можете получить закрытую форму, используя тот же метод (если вас устраивает дополнительный фактор ). И чтобы ограничить ошибку, вы можете использовать теорему Берри-Эзина вместо границы Черноффа. n
Ильяраз
@ilyaraz Я пытаюсь понять твое первое нарушение. Можете ли вы объяснить мне лучше, почему это так? Я думаю, что вы каким-то образом использовали объединение, но я не могу понять. Спасибо :)
AntonioFa