Какова ожидаемая глубина случайно сгенерированного дерева?

19

Я думал об этой проблеме очень давно, но понятия не имею об этом.

Алгоритм генерации заключается в следующем. Мы предполагаем, что существует $n$ дискретных узлов, пронумерованных от $0$ до $n - 1$ . Затем для каждого $i$ в $\{1, \dotsc, n - 1\}$ мы делаем родительский узел $i$ го узла в дереве случайным узлом в $\{0, \dotsc, i - 1\}$ . Выполните итерацию по каждому $i$ по порядку, чтобы результатом было случайное дерево с корневым узлом $0$ . (Возможно, это не достаточно случайно, но это не имеет значения.)

Какова ожидаемая глубина этого дерева?

pr.probability zhxchen17
источник

Я предполагаю, что

v_{0}

$v_0$ - root, а вы хотели сказать: «Тогда для каждого

i

$i$ в

[1, n)

$[1,n)$ мы делаем родителя

i

$i$ узла ...». Правильно?

Без названия

Что вы пробовали? Вы пытались написать рекуррентное отношение, скажем, для

d (i)

$d(i)$ которое является ожидаемой глубиной узла

i

$i$ ?

DW

3

Эти объекты известны под названием «случайное рекурсивное дерево».

Джеймс Мартин

15

Я думаю, что есть результат концентрации о $e \log n$ , но я еще не заполнил детали.

Мы можем получить верхнюю границу для вероятности того, что узел $n$ имеет $d$ предков, не включая $0$ . Для каждой возможной полной цепи $d$ ненулевых предков $(a_1,a_2,...,a_d)$ , вероятность того , что цепи $(\frac{1}{a_1})(\frac{1}{a_2})\cdots (\frac{1}{a_d}) \times \frac{1}{n}$ . Это соответствует $\frac{1}{n}$ раз срок $(1+\frac{1}{2} + \frac{1}{3}+ \cdots \frac{1}{n-1})^d$ где условия заказаны. Итак, верхняя граница для этой вероятности равна $\frac{1}{n (d!)} H_{n-1}^d$ где $H_{n-1}$ - номер $n-1$ й гармоники $1 + \frac{1}{2} + ... + \frac{1}{n-1}$ . $H_{n-1} \approx \log (n-1) + \gamma$ . Для фиксированных $d$ и $n \to \infty$ вероятность того, что узел $n$ находится на глубине $d+1$ , не превышает

\frac{(\log n)^{d}}{n (d!)} (1 + o (1))

$\frac{(\log n)^d}{n (d!)} \left(1+o(1)\right)$

По приближению Стирлинга мы можем оценить это как

\frac{1}{n \sqrt{2 π d}} {(\frac{e \log n}{d})}^{d} .

$\frac{1}{n\sqrt{2\pi d}} \left( \frac{e \log n}{d} \right)^d.$

Для больших , что-либо намного больше, чем , основание экспоненты мало, поэтому эта граница мала, и мы можем использовать границу объединения, чтобы сказать, что вероятность того, что существует хотя бы один узел с ненулевыми предками, равна небольшой. $d$ $e \log n$ $d$

Видеть

Люк Деврой, Омар Фаузи, Николас Фрейман. «Свойства глубины случайных рекурсивных деревьев масштабированного вложения».

Б. Питтел. Обратите внимание на высоты случайных рекурсивных деревьев и случайных m-арных деревьев поиска. Случайные структуры и алгоритмы, 5: 337–348, 1994.

Первые утверждают, что последняя показала, что максимальная глубина с высокой вероятностью, и предлагает другое доказательство. $(e+o(1))\log n$

Дуглас Заре
источник

2

Очень хорошо. Чтобы уточнить для других читателей: так как вы не можете повторить

, термин

a_{i}

$a_i$

- это только верхняя граница.

(1 + \frac{1}{2} + \dots + \frac{1}{n - 1})^{d}

$(1 + \frac{1}{2} + \ldots + \frac{1}{n-1})^d$

Питер Шор

3

На этот вопрос ответили несколько лет назад, но, просто для забавы, вот простое доказательство верхней границы. Мы даем оценку ожидания, а затем оценку хвоста.

Определим rv как глубину узла . Определим $d_i$ $i\in\{0,1,\ldots,n-1\}$ $\phi_i = \sum_{j=0}^i e^{d_j}.$

$E[\max_i d_i]$ $e\, H_{n-1}$

Доказательство. Максимальная глубина не более . Чтобы закончить, покажем . $\ln \phi_{n-1}$ $E[\ln \phi_{n-1}] \le e\, H_{n-1}$

Для любого , обусловливающего , путем проверки , $i\ge 1$ $\phi_{i-1}$ $\phi_i$

E [ϕ_{i} | ϕ_{i - 1}] = ϕ_{i - 1} + E [e^{d_{i}}] = ϕ_{i - 1} + \frac{e}{i} ϕ_{i - 1} = (1 + \frac{e}{i}) ϕ_{i - 1} .

$\textstyle E[\phi_i\, |\, \phi_{i-1}] \,=\,\phi_{i-1} + E[e^{d_i}] \,=\, \phi_{i-1} + \frac{e}{i} \phi_{i-1} \,=\, (1+\frac{e}{i}) \phi_{i-1}.$

По индукции следует, что

E [ϕ_{n - 1}] = \prod_{i = 1}^{n - 1} (1 + \frac{e}{i}) < \prod_{i = 1}^{n - 1} \exp (\frac{e}{i}) = \exp (e H_{n - 1}) .

$\textstyle E[\phi_{n-1}] \,=\, \prod_{i=1}^{n-1} (1+\frac{e}{i}) \,<\, \prod_{i=1}^{n-1} \exp(\frac{e}{i}) \,=\, \exp(e\, H_{n-1}).$

Таким образом, по вогнутости логарифма,

E [\ln ϕ_{n - 1}] \leq \ln E [ϕ_{n - 1}] < \ln \exp (e H_{n - 1}) = e H_{n - 1} . ◻

$E[\ln \phi_{n-1}] \,\le\, \ln E[\phi_{n-1}] \,<\, \ln \exp(e\, H_{n-1}) \,=\, e\, H_{n-1}.~~~~~~~\Box$

Вот граница хвоста:

Лемма 2. Исправить любой . Тогда не больше . $c \ge 0$ $\Pr[\max_i d_i] \ge e\,H_{n-1} + c$ $\exp(-c)$

Доказательство. При проверке и марковской границы рассматриваемая вероятность не превышает Из доказательства леммы 1 . Подставляя это в правую часть выше, завершаем доказательство. $\phi$

Pr [ϕ_{n - 1} \geq \exp (e H_{n - 1} + c)] \leq \frac{E [ϕ_{n - 1}]}{\exp (e H_{n - 1} + c)} .

$\Pr[\phi_{n-1} \ge \exp(e\,H_{n-1} + c)] \,\le\,\frac{E[\phi_{n-1}]}{\exp(e\,H_{n-1} + c)}.$

E [ϕ_{n - 1}] \leq \exp (e H_{n - 1})

$E[\phi_{n-1}]\le \exp(e\,H_{n-1})$

◻

$~~~\Box$

Что касается нижней границы, я думаю, что нижняя граница следует довольно легко, учитывая . Но... $(e-1)H_n - O(1)$ $\max_i d_i \ge \ln\phi_t - \ln n$ [РЕДАКТИРОВАТЬ: говорил слишком рано]

Кажется, не так просто показать жесткую нижнюю границу ... $(1-o(1))e H_n$

Нил Янг
источник

2

Я действительно думал об одном и том же вопросе (хотя и в совершенно другой формулировке) несколько месяцев назад, а также о некоторых близких вариантах.

У меня нет решения для закрытой формы (/ асимптотики), но вы могли бы найти это представление полезным (возможно, вы ищете только верхнюю границу?).

Процесс, который вы описываете здесь, является обобщением процесса китайского ресторана , где каждая «таблица» является поддеревом, чей родительский корень . $v_0$

Это также дает нам формулу рекурсии для вашего вопроса.

Обозначим через ожидаемые высоты такого древовидного процесса с узлами. $h(n)$ $n$

Обозначим через (Вероятность распределения узлов по поддеревьям). $P_n(B)=\frac{\Pi_{b\in B} (b-1)!}{n!}$ $B$

Тогда искомое количество определяется как: $h(n)$

h (n) = \sum_{B \in B_{n}} P_{n} (B) \cdot max_{b \in B} h (b)

$h(n)=\sum_{B\in \mathcal B_n}P_n(B)\cdot \max_{b\in B} h(b)$

Если вы хотите закодировать эту рекурсию, убедитесь, что вы используете следующее, чтобы она не пошла в бесконечный цикл:

h (n) = \frac{\sum_{B \in B_{n} ∖ {{n}}} P_{n} (B) \cdot max_{b \in B} h (b)}{1 - \frac{1}{n!}}

$h(n)=\frac{\sum_{B\in \mathcal B_n\setminus \{\{n\}\}}P_n(B)\cdot \max_{b\in B} h(b)}{1-\frac{1}{n!}}$

Где - множество всех разбиений одинаковых шаров на любое количество непустых бинов, а . $\mathcal B_n$ $n$ $h(1)=1$

На практике, когда мне это было нужно, я просто использовал простой метод Монте-Карло для оценки , поскольку попытка вычислить этим методом крайне неэффективна. $h(n)$ $h$

RB
источник

1

Спасибо за идею! На самом деле, когда я впервые столкнулся с этой проблемой, я написал программу для Монте-Карло, но, к моему удивлению, получить точный результат так сложно.

zhxchen17

Какова ожидаемая глубина случайно сгенерированного дерева?

Ответы: