Рисование n интервалов равномерно случайным образом, вероятность того, что хотя бы один интервал перекрывается со всеми остальными

17

Случайным образом нарисуйте n интервалов из [0,1] , где каждая конечная точка A, B выбрана из равномерного распределения между .[0,1]

Какова вероятность того, что хотя бы один интервал перекрывается со всеми остальными?

вендетта
источник
Вы можете посмотреть на вероятности того, что последний обращаются п меньше , чем минимум , все ранее нарисованных А , и вероятность того, что последний B п больше , чем максимум все ранее нарисованной B . Это должно быть полезно. Затем завышите вероятность, чтобы учесть тот факт, что нам нужен не последний , а любой . (У меня нет времени, чтобы AnABnB
разобраться с
Может быть несколько удивительно, что (1) ответ не зависит от распределения (только то, что он будет непрерывным) и (2) для n>1 он постоянен!
whuber
1
Так строится n- й интервал: i) равномерно случайным образом нарисовать два числа из [0,1], ii) пусть меньшим будет An а большим Bn ?
ekvall

Ответы:

5

Этот пост отвечает на вопрос и описывает частичный прогресс в доказательстве его правильности.


Для ответ тривиально равен 1 . Для всех больших пn=11n , то (удивительно) всегда .2/3

Чтобы понять почему, сначала отметим, что вопрос можно обобщить на любое непрерывное распределение (вместо равномерного распределения). Процесс, с помощью которого создаются n интервалов, приводит к вытягиванию 2 n iid переменных X 1 , X 2 , , X 2 n из F и формированию интерваловFn2nX1,X2,,X2nF

[min(X1,X2),max(X1,X2)],,[min(X2n1,X2n),max(X2n1,X2n)].

Поскольку все из X i независимы, они являются взаимозаменяемыми. Это означает, что решение было бы таким же, если бы мы были случайным образом переставить их всех. Поэтому приведем условие для статистики порядка, полученной путем сортировки X i :2nXiXi

X(1)<X(2)<<X(2n)

(где, поскольку непрерывен, существует нулевая вероятность того, что любые два будут равны). В п интервалы формируются путем выбора случайной перестановки сг š 2 н и соединяя их в парахFnσS2n

[min(Xσ(1),Xσ(2)),max(Xσ(1),Xσ(2))],,[min(Xσ(2n1),Xσ(2n)),max(Xσ(2n1),Xσ(2n))].

Независимо от того, перекрываются ли эти два параметра или нет, не зависит от значений ,X(i) поскольку перекрытие сохраняется любым монотонным преобразованием и существуют такие преобразования, которые отправляют X ( i ) в i . Таким образом, без потери общности мы можем принять X ( i ) = i, и возникает вопрос:f:RRX(i)iX(i)=i

Пусть множество разбито на n непересекающихся дублетов. Любые два из них, { l 1 , r 1 } и { l 2 , r 2 }l i < r i ), перекрываются, когда r 1 > l 2 и r 2 > l 1{1,2,,2n1,2n}n{l1,r1}{l2,r2}li<rir1>l2r2>l1, Скажите, что раздел «хороший», когда хотя бы один из его элементов перекрывает все остальные (а в противном случае «плохой»). Какая доля хороших разбиений зависит от ?n

Для иллюстрации рассмотрим случай . Есть три раздела,n=2

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

из которых два хороших (второй и третий) были окрашены в красный цвет. Таким образом, ответ в случае является 2 / 3 .n=22/3

Мы можем построить график таких разделов путем построения точек { 1 , 2 , , 2 n } на числовой линии и рисования отрезков между каждым l i и r i , слегка смещая их для устранения визуальных перекрытий. Вот графики предыдущих трех разделов, в том же порядке с одинаковой раскраской:{{li,ri},i=1,2,,n}{1,2,,2n}liri

Figure 1

Отныне, чтобы легко разместить такие графики в этом формате, я поверну их вбок. Например, вот разделов для n = 3 , еще раз с хорошими, выделенными красным:15n=3

Figure 2

Десять хорошо, так что ответ на является 10 / 15 = 2 / 3 .n=310/15=2/3

Первая интересная ситуация возникает при . Теперь впервые возможно, чтобы объединение интервалов охватывало от 1 до 2 n, при этом ни один из них не пересекает другие. Примером является { { 1 , 3 } , { 2 , 5 } , { 4 , 7 } , { 6 , 8 } } . Объединение отрезков проходит непрерывно от 1 до 8n=412n{{1,3},{2,5},{4,7},{6,8}}18 но это не очень хороший раздел. Тем не менее, из70 разделовявляются хорошимии доля остается 2 / 3 .1052/3


The number of partitions increases rapidly with n: it equals 1352n1=(2n)!/(2nn!). Exhaustive enumeration of all possibilities through n=7 continues to yield 2/3 as the answer. Monte-Carlo simulations through n=100 (using 10000 iterations in each) show no significant deviations from 2/3.

I am convinced there is a clever, simple way to demonstrate there is always a 2:1 ratio of good to bad partitions, but I have not found one. A proof is available through careful integration (using the original uniform distribution of the Xi), but it is rather involved and unenlightening.

whuber
источник
Very cool. I have a hard time following what it means to "condition on the order statistics", would it be possible to add a line of intuition? Seems like a useful technique. I understand up to that the Xi are exchangeable, indeed even iid, that that this allows us to consider any permutation.
ekvall
1
@Student To "condition on" means to say, let's temporarily hold these values fixed and consider what we can learn from that. Later, we will let those values vary (according to their probability distribution). In this case, once we find that the answer is 2/3 regardless of the fixed values of the order statistics, then we no longer have to carry out the second step of varying the order statistics. Mathematically, the order stats are a vector-valued variable X and the indicator of being good is Y, so
E(Y)=E(E(Y|X))=E(2/3)=2/3.
whuber