Рассмотрим
где - iid и CLT имеет место.
Сколько самых больших терминов составляют половину общей суммы?
Например, 10 + 9 + 8 (10 + 9 + 8 + 1) / 2: 30% терминов достигают примерно половины общего числа.
определять
Существует ли общий асимптотический результат для полусуммы ( )?
Простой, интуитивный вывод был бы хорош.
(Немного Монте-Карло предполагает, что иногда halfsum ( ) / 4 или около того;
то есть наибольшая 1/4 от составляет в сумме половину от общего.
Я получаю 0,24 для полнормального, 0,19 для экспоненциальный, для = 20, 50, 100.)
Ответы:
Нет, общего асимптотического результата нет. Пусть будет упорядоченным x i , где x [ 1 ] является наибольшим.x[1]…x[N] xi x[1]
Рассмотрим следующие два примера:
1) . Ясно, что CLT держит. Вам нужно только M = 1 наблюдение для ∑ M j = 1 | x [ j ] | ≥ 1P(x=0)=1 M=1 , ∑Mj=1|x[j]|≥12∑N|xi|
2) . Ясно, что CLT держит. Вам нужно M = ⌈ N / 2 ⌉ наблюдений для ∑ M j = 1 | x [ j ] | ≥ 1P(x=1)=1 M=⌈N/2⌉ ,∑Mj=1|x[j]|≥12∑N|xi|
Для нетривиального примера распределение Бернулли:
3) . Еще раз CLT держит. Вам нужно ⌈ p N / 2 ⌉ наблюдений, чтобы удовлетворить ваши условия. Изменяя p между 0 и 1, вы можете получить как можно ближе к примеру 1 или примеру 2.P(x=1)=p, P(x=0)=1−p ⌈pN/2⌉ p
источник
Вот грубый аргумент, дающий немного иную оценку для равномерно распределенных случайных величин. Предположим, что - непрерывные случайные величины, равномерно распределенные на [ 0 , 1 ] . Тогда ∑ i X i имеет среднее значение N / 2 . Предположим, что по удивительному и совершенно невероятному совпадению сумма точно равна N / 2 . Поэтому мы хотим оценить, сколько из самых больших значений X составляет до N / 4 или более. Теперь гистограмма из N образцов ( NXi [0,1] ∑iXi N/2 N/2 X N/4 N N очень большой), взятый из равномерного распределения
, приблизительно плоский от 0 до 1 , и поэтому для любых x , 0 < x < 1 , есть
( 1 - x ) N выборок, распределенных примерно равномерно между x к 1 , Эти образцы имеют среднее значение ( 1 + x ) / 2 и сумму, равную
( 1 - x ) N (U[0,1] 0 1 x 0<x<1 (1−x)N x 1 (1+x)/2 . Сумма превышает N / 4 для x ≤ 1 / √(1−x)N(1+x)/2)=(1−x2)N/2 N/4 . Итак, сумма(1-1/ √x≤1/2–√ самых больших выборок превышает
N/4.(1−1/2–√)N≈0.3N N/4
источник
Давайте предположим, что X имеет только положительные значения, чтобы избавиться от абсолютного значения.
Без точного доказательства, я думаю, вы должны решить для к
и тогда ответ дается, беря самые высокие значения.n(1−FX(k))
Моя логика заключается в том, что асимтотически сумма всех значений выше k должна быть примерно равна
и асимтотически половина общей суммы составляет около
Численное моделирование показывает, что результат справедлив для равномерного случая (равномерного в ), где и я получаю . Я не уверен, что результат всегда выполняется или его можно упростить, но я думаю, что он действительно зависит от функции распределения F.F ( k ) = k k = √[0,1] F(k)=k k=(√12)
источник