Какова дисперсия максимума выборки?

13

B

Var(maxiXi)B,
X={X1,,XM}Mμ1,,μMσ12,,σM2

Я могу вывести это но эта граница кажется очень свободной. Численный тест показывает, что может быть возможным, но я не смог доказать это. Любая помощь приветствуется.

Var(maxiXi)iσi2,
B=maxiσi2
Питер
источник
3
(Вы хотите предположить, что независимы?) Эта гипотеза правдоподобна, но кажется ложной. Например, проведите несколько испытаний, где идентифицированы с CDF , , . Дисперсия их максимума относительно их общей дисперсии возрастает без ограничения какX i 1 - x 1 - s 1 x s > 3 MXiXi1x1s1xs>3M роста
whuber
@whuber Спасибо, это объясняет, почему я не смог доказать эту гипотезу :) Меня действительно интересует случай, когда независимы. Просто чтобы уточнить, меня больше всего интересуют общие оценки, которые используют только первые два момента. Я не уверен, существуют ли даже более четкие общие границы, чем общая дисперсия. Xi
Питер
1
Я должен указать, что ваша оценка суммы (при условии, что она правильная - было бы неплохо увидеть набросок доказательства) является жесткой. Например, пусть поддерживается на интервале [ - , a ] с дисперсиями, не превышающими ε 2, и пусть X 1 поддерживается на [ a , ] . Тогда max i X i = X 1 as, с дисперсией + ( M - 1 ) εX2,,XM[,a]ε2X1[a,]maxiXi=X1σ12σ12+(M1)ε2 , но неравенство можно ужесточить настолько, насколько вы захотите, уменьшив . ε2
whuber
1
Для данных iid теория экстремальных значений предоставляет классы распределений, к которым сходится максимум выборки, с определенными условиями на хвостах исходных распределений, дающих различные классы асимптотических распределений. Поэтому я сомневаюсь, что вы сможете получить хорошую оценку, основываясь только на двух моментах, хотя я лишь косвенно знаком с этой теорией.
StasK

Ответы:

9

Для любых случайных величин X i наилучшей общей оценкой является V a r ( max X i ) i V a r ( X i ), как указано в исходном вопросе. Вот набросок доказательства: если X, Y - IID, то E [ ( X - Y ) 2 ] = 2 V a r ( X ) . Дан вектор возможных зависимых переменных ( X 1 , nXiVar(maxXi)iVar(Xi)E[(XY)2]=2Var(X) , пусть ( Y 1 , , Y n(X1,,Xn) быть независимым вектором с таким же совместным распределением. Для любого r > 0 мы имеем по объединенной границе, что P [ | max i X i - max i Y i | 2 > r ] i P [ | X , и интегрируя это(Y1,,Yn)r>0P[|maxiXimaxiYi|2>r]iP[|XiYi|2>r] от 0 до дает заявленное неравенство.dr0

Если являюсь IID индикаторов событий вероятности е , то макс Х я являюсь показателем события вероятности п е + O ( п 2 е 2 ) . Зафиксируя n и положив ϵ стремиться к нулю, мы получаем V a r ( X i ) = ϵ - ϵ 2 и V a r ( max i X i ) = n ϵ +XiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵϵ2 .Var(maxiXi)=nϵ+O(n2ϵ2)

Юваль Перес
источник
3

Вопрос по MathOverflow связан с этим вопросом.

Для случайных величин IID е старшее число называется статистикой порядка .k

Даже для случайных величин IID Бернулли дисперсия любой статистики порядка, кроме медианы, может быть больше, чем дисперсия совокупности. Например, если это 1 с вероятностью 1 / 10 и 0 с вероятностью 9 / 10 и М = 10 , то максимальное значение 1 с вероятностью 1 - 1 / е , так что дисперсия населения 0,09 в то время дисперсии максимум составляет около 0,23 .Xi11/1009/10M=10111/e0.090.23

Вот две статьи о дисперсиях статистики заказов:

Ян, Х. (1982). «О дисперсиях медианы и некоторых других статистических порядках». Bull. Текущий месяц Математика Акад. Синика, 10 (2) с. 197-204

Пападатос, Н. (1995) "Максимальная дисперсия статистики порядка". Энн. Текущий месяц Statist. Матем., 47 (1) с. 185-193

Я полагаю, что верхняя граница дисперсии максимума во второй статье равна . Они указывают на то, что равенство не может произойти, но может быть любое меньшее значение для случайных величин IID Бернулли.Mσ2

Дуглас Заре
источник