Лавина как случайный процесс

Рассмотрим следующий процесс:

Есть корзин, расположенных сверху вниз. Первоначально, каждая корзина содержит один шар. На каждом шагу мы $n$

выбрать мяч равномерно наугад и $b$

переместите все шары из корзины, содержащей в корзину под ней. Если это уже была самая низкая корзина, мы удаляем шары из процесса. $b$

Сколько шагов нужно ожидать, пока процесс не завершится, т. Е. Пока все шариков не будут удалены из процесса? Это изучалось раньше? Ответ легко следует из известных методов? $n$

В лучшем случае процесс может завершиться через шагов. В худшем случае это может сделать шагов. Оба случая должны быть очень маловероятными, хотя. Моя гипотеза состоит в том, что он принимает шагов, и я провел несколько экспериментов, которые, кажется, подтверждают это. $n$ $\Theta(n^2)$ $\Theta(n\log n)$

(Обратите внимание, что выбор корзины равномерно наугад - это совсем другой процесс, который, очевидно, потребует шагов для завершения.) $\Theta(n^2)$

pr.probability markov-chains stochastic-process Матиас
источник

Вопрос выглядит интересным (хотя я не знаю ответа). Это кажется трудным из-за немонотонности; если все n шаров находятся в верхней корзине, процесс явно завершается ровно за n шагов.

Цуёси Ито

Ответы:

Не совсем ответ, а расширенный комментарий к ответу Андраса.

Ответ Андраса содержит приятную интуицию, хотя я не верю, что это строгий расчет ожидаемого количества шагов. Я думаю, что это, возможно, хорошее приближение к ответу, но, похоже, оно не имеет должного отношения к случаям, когда корзина ниже самой высокой занятой корзины становится пустой до того, как верхняя корзина опустошается вниз. Тем не менее, это может быть разумным приближением (я не уверен).

Его расчет содержит ошибку, которая влияет на масштабирование. Я собираюсь взять точно такую же отправную точку, и повторить и расширить расчет.

Он пропускает коэффициент p внутри суммирования, так как вероятность случайного выбора правильного бина равна а не $\frac{p}{n}$ . В результате мы имеем $\frac{1}{n}$

$\begin{eqnarray*} n + \sum_{p=1}^n \sum_{k=0}^{\infty} (k+1) \frac{p}{n} \left(\frac{n-p}{n}\right)^k & = & n + \sum_{p=1}^{n} \frac{p}{n} \sum_{k=0}^{\infty} (k+1) \left(\frac{n-p}{n}\right)^k \\\\& = & n + \sum_{p=1}^{n} \frac{p}{n} \cdot \frac{n^2}{p^2} \\\\& = & n + n\sum_{p=1}^{n} 1/p \\\\& = & n (1+H_n) \end{eqnarray*}$

где - это n-е гармоническое число . Чтобы приблизить мы можем просто заменить суммирование на интеграл: $H_n = \sum_{p=1}^{n} 1/p$ $H_n$ . Таким образом, масштабирование составляетили приблизительно. Хотя это масштабирование не соответствует точно масштабированию задачи (см. Моделирование ниже), оно почти точно уменьшается в. $H_n \approx \int_{1}^{n+1} \frac{1}{x} dx = \log(n+1)$ $n (1+\log(n+1))$ $n \log(n+1)$ $\log(2)$

Симуляция против теории

Красные круги: Точки данных от моделирования процесса в среднем за 10 000 циклов. Зеленый: . Синий: . $n \log_2(n+1)$ $n \log(n+1)$

Джо Фитцсимонс
источник

@Joe: Хорошая работа! Было бы интересно сейчас строго показать, как фактор

возникает из-за создания пробелов.

\ln 2

$\ln 2$

Андрас Саламон

@ András: У меня нет особого ощущения, является ли это обоснованным приближением или нет. @ Идея Питера о формировании сгустков, которые смещаются вниз, похоже, должна дать правильное выражение, предполагая, что они одинаково вероятны в любом бункере.

Джо Фицсимонс

@Joe: самый верхний шар останется изолированным почти в 1/3 случаев. Рассмотрим 3 верхних мяча. Если первый выбирается средний (из этих 3), он присоединится к третьему. С тех пор эти двое будут двигаться в два раза быстрее, чем главный мяч. Расстояние между ними и верхним шаром является случайным блужданием с сильным смещением, и вероятность того, что верхний шар наверстает упущенное, ограничена малой постоянной (грубая оценка) (приблизительная оценка 15%). Но хорошая новость заключается в том, что топ-логин не должен иметь большого значения. Если все остальное будет очищено за n \ logn шагов, они будут добавлять только дополнительные n \ logn шагов.

Матиас

Вот два сюжета. Оба показывают количество шагов, деленное на

, пока все, кроме

шариков, не будет очищено. Для первого шарики, которые выпадают из системы, все еще могут быть выбраны (как предложил Андраш): tinyurl.com/2wg7a9y . Во втором случае шары, выпадающие из системы, больше не выбираются: tinyurl.com/33b63pq . Как видите, границы, которые может дать первый процесс, вероятно, слишком слабы. Может быть, это можно настроить, рассматривая фазы (как Питер написал где-то), в которых мы всегда вдвое уменьшаем количество шаров в системе?

n

$n$

\log n

$\log n$

Матиас

@Matthias: Анализ ожидаемого времени при условии, что интуиция Питера верна, не является препятствием (по крайней мере, с моей точки зрения). Мне сначала нужно доказать, что эта интуиция на самом деле является справедливым отражением того, что происходит, хотя я подозреваю, что это хорошее приближение.

Джо Фицсимонс

Редактировать: я оставляю этот ответ как есть (пока), чтобы проиллюстрировать грязный процесс доказательства теорем, что-то, что осталось из опубликованных работ. Основная интуиция здесь заключается в том, что достаточно сфокусироваться на верхнем шаре, так как он сметает все под ним. Пожалуйста, смотрите комментарии (в частности, @Michael, указывающий на возможные пробелы) и более поздний ответ @ Joe о том, как ошибки были выявлены и исправлены. Мне особенно нравится использование экспериментов Джо, чтобы перепроверить, что формулы были разумными.

$n$ $(1 + \pi^2/6)n$

$b_1b_2\cdots b_n$ $b_1 = n$ $b_2 \ge n-1$ $\dots$ $b_i \ge n-i+1$ $b_1$ $b_2$ $b_n$ $1,2,\ldots,n$ ). Это можно рассматривать как отдельные события, одно за другим. Ожидаемое количество шагов тогда

$\begin{eqnarray*}n + \sum_{p=1}^n \sum_{k=0}^{\infty} \frac{k+1}{n} \left(\frac{n-p}{n}\right)^k & = & n + \sum_{p=1}^{n-1} \frac{1}{n-p} \sum_{k=1}^{\infty} k\left(\frac{n-p}{n}\right)^k \\& = & n + \sum_{p=1}^{n-1} \frac{1}{n-p} n(n-p)/p^2 \\& = & n + n\sum_{p=1}^{n-1} 1/p^2 \\& \le & (1 + \pi^2/6)n. \end{eqnarray*}$

András Salamon
источник

@Andras @Joe: Holy schmoley. If all the people asking the questions on this site took their questions as seriously as you take answering them, this would be the badassest url on the internet.

Aaron Sterling

@András: I'm trying to understand your statement "a sequence of balls will clear all the bins precisely if it contains a subsequence...". Maybe I've misunderstood something, but say we have four balls. If the sequence is 3,4,3,2,4 then it seems to satisfy your subsequence requirement, yet not all the bins have been cleared.

Michael

@ Андрас: Если вы хотите показать разумную верхнюю границу, вы должны использовать тот факт, что шары исчезают из процесса и больше не выбираются. В противном случае самый верхний шар всегда выбирается только с вероятностью 1 / n, и есть большая вероятность (возможно, чуть меньше 1/2), что этот шар будет оставаться изолированным все время. Для этого шара вам понадобится n ^ 2 шага.

Матиас

@Michael: I think you have identified the mistake. I'm assuming falsely that the top ball will move down even if there is a gap.

András Salamon

Here's my intuition. After a few steps, some clump of balls is going to be larger than any other clump of balls. At this point, the clump moves faster than everything else, clears everything below it and falls out of the system. This whole process should take

O (n)

$O(n)$ or maybe

O (n \log n)

$O(n \log n)$ steps. This first clump is uniformly distributed in the line, so on average it takes half the balls with it. Now, we're left with a system of around

n / 2

$n/2$ balls, and another clump forms. So after around

\log n

$\log n$ clumps, we're done.

Peter Shor