Пусть палка длиной 1 разбита на фрагменты равномерно случайным образом. Каково распределение длины самого длинного фрагмента?
Более формально, пусть будет IID , и будет ассоциированная статистика порядка, т.е. мы просто упорядочим выборку в таком виде таким образом, что . Позволять .
Я заинтересован в распределении . Моменты, асимптотические результаты или приближения для также интересны.
Ответы:
С информацией, предоставленной @Glen_b, я смог найти ответ. Используя те же обозначения, что и вопрос
где если a > 0 и 0 в противном случае. Я также даю ожидание и асимптотическую сходимость к распределению Гамбеля ( NB : не бета)a+=a a>0 0
Материал доказательств взят из нескольких публикаций, ссылки на которые приведены в ссылках. Они несколько длинные, но прямые.
1. Доказательство точного распределения
Пусть - IID равномерных случайных величин в интервале ( 0 , 1 ) . Упорядочив их, мы получаем статистику k порядка, обозначенную ( U ( 1 ) , … , U ( k ) ) . Равномерное расстояние определяется как Δ i = U ( i ) - U ( i - 1 ) , где U ((U1,…,Uk) (0,1) k (U(1),…,U(k)) Δi=U(i)−U(i−1) иU(0)=0 . Упорядоченные интервалы - это соответствующие упорядоченные статистические данные Δ ( 1 ) ≤ … ≤ Δ ( k + 1 ) . Интересующая переменная Δ ( k + 1 ) .U(k+1)=1 Δ(1)≤…≤Δ(k+1) Δ(k+1)
For fixedx∈(0,1) , we define the indicator variable 1i=1{Δi>x} . By symmetry, the random vector (11,…,1k+1) is exchangeable, so the joint distribution of a subset of size j is the same as the joint distribution of the first j . By expanding the product, we thus obtain
IfΔ1>x , the k breakpoints are in the interval (x,1) . Conditionally on this event, the breakpoints are still exchangeable, so the probability that the distance between the second and the first breakpoint is greater than x is the same as the probability that the distance between the first breakpoint and the left barrier (at position x ) is greater than x . So
2. Expectation
For distributions with finite support, we have
Integrating the distribution ofΔ(k+1) , we obtain
With the change of variableu=1−x and expanding the product, we obtain
3. Alternative construction of uniform spacings
In order to obtain the asymptotic distribution of the largest fragment, we will need to exhibit a classical construction of uniform spacings as exponential variables divided by their sum. The probability density of the associated order statistics(U(1),…,U(k)) is
If we denote the uniform spacingsΔi=U(i)−U(i−1) , with U(0)=0 , we obtain
By definingU(k+1)=1 , we thus obtain
Now, let(X1,…,Xk+1) be IID exponential random variables with mean 1, and let S=X1+…+Xk+1 . With a simple change of variable, we can see that
DefineYi=Xi/S , such that by a change of variable we obtain
Integrating this density with respect tos , we thus obtain
So the joint distribution ofk+1 uniform spacings on the interval (0,1) is the same as the joint distribution of k+1 exponential random variables divided by their sum. We come to the following equivalence of distribution
4. Asymptotic distribution
Using the equivalence above, we obtain
whereTk+1=X1+…+Xk+1k+1−1 . This variable vanishes in probability because E(Tk+1)=0 and Var(log(k+1)Tk+1)=(log(k+1))2k+1↓0 . Asymptotically, the distribution is the same as that of X(k+1)−log(k+1) . Because the Xi are IID, we have
5. Graphical overview
The plot below shows the distribution of the largest fragment for different values ofk . For k=10,20,50 , I have also overlaid the asymptotic Gumbel distribution (thin line). The Gumbel is a very bad approximation for small values of k so I omit them to not overload the picture. The Gumbel approximation is good from k≈50 .
6. References
The proofs above are taken from references 2 and 3. The cited literature contains many more results, such as the distribution of the ordered spacings of any rank, their limit distribution and some alternative constructions of the ordered uniform spacings. The key references are not easily accessible, so I also provide links to the full text.
источник
This is not a complete answer, but I did some quick simulations, and this is what I obtained:
This looks remarkably beta-ish, and this makes a bit of sense, since the order statistics of i.i.d. uniform distributions are beta wiki.
This might give some starting point to derive the resulting p.d.f..
I'll update if I get to a final closed solution.
Cheers!
источник
Я подготовил ответ для конференции в Сиене (Италия) в 2005 году. Документ (2006 год) представлен на моем веб-сайте здесь (pdf) . Точные распределения всех расстояний (от самых маленьких до самых больших) приведены на страницах 75 и 76.
Я надеюсь выступить с докладом на эту тему на конференции RSS в Манчестере (Англия) в сентябре 2016 года.
источник