Я могу вывести это
но эта граница кажется очень свободной. Численный тест показывает, что может быть возможным, но я не смог доказать это. Любая помощь приветствуется.
(Вы хотите предположить, что независимы?) Эта гипотеза правдоподобна, но кажется ложной. Например, проведите несколько испытаний, где идентифицированы с CDF , , . Дисперсия их максимума относительно их общей дисперсии возрастает без ограничения какX i 1 - x 1 - s 1 ≤ x ≤ ∞ s > 3 MXiXi1−x1−s1≤x≤∞s>3M роста
whuber
@whuber Спасибо, это объясняет, почему я не смог доказать эту гипотезу :) Меня действительно интересует случай, когда независимы. Просто чтобы уточнить, меня больше всего интересуют общие оценки, которые используют только первые два момента. Я не уверен, существуют ли даже более четкие общие границы, чем общая дисперсия. Xi
Питер
1
Я должен указать, что ваша оценка суммы (при условии, что она правильная - было бы неплохо увидеть набросок доказательства) является жесткой. Например, пусть поддерживается на интервале [ - ∞ , a ] с дисперсиями, не превышающими ε 2, и пусть X 1 поддерживается на [ a , ∞ ] . Тогда max i X i = X 1 as, с дисперсией + ( M - 1 ) εX2,…,XM[−∞,a]ε2X1[a,∞]maxiXi=X1σ21≤σ21+(M−1)ε2 , но неравенство можно ужесточить настолько, насколько вы захотите, уменьшив . ε2
whuber
1
Для данных iid теория экстремальных значений предоставляет классы распределений, к которым сходится максимум выборки, с определенными условиями на хвостах исходных распределений, дающих различные классы асимптотических распределений. Поэтому я сомневаюсь, что вы сможете получить хорошую оценку, основываясь только на двух моментах, хотя я лишь косвенно знаком с этой теорией.
StasK
Ответы:
9
Для любых случайных величин X i наилучшей общей оценкой является
V a r ( max X i ) ≤ ∑ i V a r ( X i ), как указано в исходном вопросе. Вот набросок доказательства: если X, Y - IID, то E [ ( X - Y ) 2 ] = 2 V a r ( X ) . Дан вектор возможных зависимых переменных ( X 1 , …nXiVar(maxXi)≤∑iVar(Xi)E[(X−Y)2]=2Var(X) , пусть ( Y 1 , … , Y n(X1,…,Xn) быть независимым вектором с таким же совместным распределением. Для любого r > 0 мы имеем по объединенной границе, что P [ | max i X i - max i Y i | 2 > r ] ≤ ∑ i P [ | X , и интегрируя это(Y1,…,Yn)r>0P[|maxiXi−maxiYi|2>r]≤∑iP[|Xi−Yi|2>r] от 0 до ∞ дает заявленное неравенство.dr0∞
Если являюсь IID индикаторов событий вероятности е , то макс Х я являюсь показателем события вероятности п е + O ( п 2 е 2 ) . Зафиксируя n и положив ϵ стремиться к нулю, мы получаем V a r ( X i ) = ϵ - ϵ 2 и V a r ( max i X i ) = n ϵ +XiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵ−ϵ2 .Var(maxiXi)=nϵ+O(n2ϵ2)
Для случайных величин IID е старшее число называется статистикой порядка .k
Даже для случайных величин IID Бернулли дисперсия любой статистики порядка, кроме медианы, может быть больше, чем дисперсия совокупности. Например, если это 1 с вероятностью 1 / 10 и 0 с вероятностью 9 / 10 и М = 10 , то максимальное значение 1 с вероятностью ≈ 1 - 1 / е , так что дисперсия населения 0,09 в то время дисперсии максимум составляет около 0,23 .Xi11/1009/10M=101≈1−1/e0.090.23
Вот две статьи о дисперсиях статистики заказов:
Ян, Х. (1982). «О дисперсиях медианы и некоторых других статистических порядках». Bull. Текущий месяц Математика Акад. Синика, 10 (2) с. 197-204
Я полагаю, что верхняя граница дисперсии максимума во второй статье равна . Они указывают на то, что равенство не может произойти, но может быть любое меньшее значение для случайных величин IID Бернулли.Mσ2
Ответы:
Для любых случайных величин X i наилучшей общей оценкой является V a r ( max X i ) ≤ ∑ i V a r ( X i ), как указано в исходном вопросе. Вот набросок доказательства: если X, Y - IID, то E [ ( X - Y ) 2 ] = 2 V a r ( X ) . Дан вектор возможных зависимых переменных ( X 1 , …n Xi Var(maxXi)≤∑iVar(Xi) E[(X−Y)2]=2Var(X) , пусть ( Y 1 , … , Y n(X1,…,Xn) быть независимым вектором с таким же совместным распределением. Для любого r > 0 мы имеем по объединенной границе, что P [ | max i X i - max i Y i | 2 > r ] ≤ ∑ i P [ | X , и интегрируя это(Y1,…,Yn) r>0 P[|maxiXi−maxiYi|2>r]≤∑iP[|Xi−Yi|2>r] от 0 до ∞ дает заявленное неравенство.dr 0 ∞
Если являюсь IID индикаторов событий вероятности е , то макс Х я являюсь показателем события вероятности п е + O ( п 2 е 2 ) . Зафиксируя n и положив ϵ стремиться к нулю, мы получаем V a r ( X i ) = ϵ - ϵ 2 и V a r ( max i X i ) = n ϵ +Xi ϵ maxXi nϵ+O(n2ϵ2) n ϵ Var(Xi)=ϵ−ϵ2 .Var(maxiXi)=nϵ+O(n2ϵ2)
источник
Вопрос по MathOverflow связан с этим вопросом.
Для случайных величин IID е старшее число называется статистикой порядка .k
Даже для случайных величин IID Бернулли дисперсия любой статистики порядка, кроме медианы, может быть больше, чем дисперсия совокупности. Например, если это 1 с вероятностью 1 / 10 и 0 с вероятностью 9 / 10 и М = 10 , то максимальное значение 1 с вероятностью ≈ 1 - 1 / е , так что дисперсия населения 0,09 в то время дисперсии максимум составляет около 0,23 .Xi 1 1/10 0 9/10 M=10 1 ≈1−1/e 0.09 0.23
Вот две статьи о дисперсиях статистики заказов:
Ян, Х. (1982). «О дисперсиях медианы и некоторых других статистических порядках». Bull. Текущий месяц Математика Акад. Синика, 10 (2) с. 197-204
Пападатос, Н. (1995) "Максимальная дисперсия статистики порядка". Энн. Текущий месяц Statist. Матем., 47 (1) с. 185-193
Я полагаю, что верхняя граница дисперсии максимума во второй статье равна . Они указывают на то, что равенство не может произойти, но может быть любое меньшее значение для случайных величин IID Бернулли.Mσ2
источник