Анализ шаров и бинов в режиме m >> n.

17

Хорошо известно, что если вы бросите n шаров в n корзин, то в самой загруженной корзине, скорее всего, будет шариков. В общем, можно спросить о шарах в корзинах. В статье из RANDOM 1998, опубликованной Раабом и Стегером, это подробно рассматривается, показывая, что с ростом вероятность того, что даже немного превысит ожидаемое значение быстро уменьшится. Грубо говоря, установив , они показывают, что вероятность увидеть больше, чем составляет .O(logn)м>NNмм/Nрзнак равном/Nр+ржурналNо(1)

Эта статья появилась в 1998 году, и я не нашел ничего более свежего. Есть ли новые и даже более концентрированные результаты в этом направлении, или есть эвристические / формальные причины подозревать, что это лучшее, что можно получить? Я должен добавить, что в соответствующем документе по варианту с множественным выбором, написанном в соавторстве с Анжеликой Стегер в 2006 году, также нет ссылок на более поздние работы.

Обновление : в ответ на комментарий Питера, позвольте мне уточнить, что я хотел бы знать. У меня здесь две цели.

  1. Во-первых, мне нужно знать, какую ссылку цитировать, и кажется, что это самая последняя работа по этому вопросу.
  2. Во-вторых, это правда, что результат достаточно плотный в диапазоне r = 1. Меня интересует диапазон m >> n, в частности, область, где r может быть poly log n или даже n ^ c. Я пытаюсь вставить этот результат в лемму, которую я доказываю, и конкретное ограничение на r контролирует другие части общего алгоритма. Я думаю (но не уверен), что диапазон r, предоставленный в этой статье, может быть достаточным, но я просто хотел убедиться, что не было более жесткой границы (это дало бы лучший результат).
Суреш Венкат
источник
3
Я узнал название «проблема занятости» из тега, так что спасибо за размещение учебного вопроса. :)
Tsuyoshi Ito
7
Глядя на статью Рааба и Стегера, мне трудно понять, каких еще результатов вы бы хотели достичь в этом направлении. Есть ли конкретный вопрос, на который вам нужно знать ответ? Если это так, вы должны спросить об этом, либо здесь, либо в MathOverflow. В частности, если , Рааб и Стегер дают точную границу где - правильная постоянная. r + r=m/n 2r+2rlogn2
Питер Шор
@Peter Я отредактирую вопрос: это верная точка.
Суреш Венкат

Ответы:

8

Не совсем полный ответ (и не полезная ссылка), а просто расширенный комментарий. Для любого данного бина вероятность того, что в нем будет ровно шаров, будет определяться как . Мы можем использовать неравенство из-за Sondow, , чтобы получить , где . Обратите внимание, что эта граница довольно узкая, так как a .p B = ( мВ((b+1)aпВзнак равно(мВ)(1N)В(N-1N)м-ВpB<((r+1)r+1((б+1)aa)<((б+1)б+1бб)ar=mпВ<((р+1)р+1рр)В(1N)В(N-1N)м-В ( (Ь+1)рзнак равномВ-1((б+1)aa)>14aб((б+1)б+1бб)a

Таким образом, мы имеем . Теперь, так как вас интересует вероятность нахождения или более шаров в корзине, мы можем рассмотреть . Переставляя термины, мы получаем B p B = m b = B p b < Σ м б = В е б ( г + 1pB<eB(r+1)ln(r+1)Brlnrmlnn+(mB)ln(n1)B p B < e - m ln npB=b=Bmpb<b=Bmeb(r+1)ln(r+1)brlnrmlnn+(mb)ln(n1)

pB<emlnnn1×eB(r+1)ln(r+1)BrlnrBln(n1)b=0mBeb(r+1)ln(r+1)brlnrbln(n1).

Обратите внимание, что приведенное выше суммирование является просто геометрическим рядом, поэтому мы можем упростить его, чтобы получитьЕсли мы переписываем термины используя экспоненты, мы получаем который затем становится

pB<emlnnn1×eB(r+1)ln(r+1)BrlnrBln(n1)×1((r+1)r+1rr(n1))mB+11((r+1)r+1rr(n1)).
(r+1)r+1rr(n1)
pB<emlnnn1×eB(r+1)ln(r+1)BrlnrBln(n1)×1(e(r+1)ln(r+1)rlnrln(n1))mB+11e(r+1)ln(r+1)rlnrln(n1),
pB<emlnnn1×(eB((r+1)ln(r+1)rlnrln(n1))e(m+1)((r+1)ln(r+1)rlnrln(n1)))1e(r+1)ln(r+1)rlnrln(n1).

Теперь, я так понимаю, вы заботитесь о том, чтобы найти некоторый такой, что для некоторой константы , поскольку это дает полную вероятность того, что любой бин, имеющий или более шаров, будет сверху . Этот критерий выполняется, если взять что может переписать какBpB<CnCBC

emlnnn1×(eB((r+1)ln(r+1)rlnrln(n1))e(m+1)((r+1)ln(r+1)rlnrln(n1)))1e(r+1)ln(r+1)rlnrln(n1)=Cn,
B=ln(Cnemlnnn1(1e(r+1)ln(r+1)rlnrln(n1))+e(m+1)((r+1)ln(r+1)rlnrln(n1)))(r+1)ln(r+1)rlnrln(n1).

Я не совсем уверен, насколько этот комментарий будет вам полезен (вполне возможно, что я где-то допустил ошибку), но, надеюсь, он может быть полезным.

Джо Фитцсимонс
источник
1
это довольно круто спасибо за наброски.
Суреш Венкат
@Suresh: рад, что это полезно.
Джо Фицсимонс