Какова дисперсия максимума выборки?

$B$

Var (max_{i} X_{i}) \leq B,

$\mbox{Var}(\max_i X_i) \leq B \enspace,$

X = {X_{1}, \dots, X_{M}}

$X = \{ X_1, \ldots, X_M \}$

M

$M$

μ_{1}, \dots, μ_{M}

$\mu_1, \ldots, \mu_M$

σ_{1}^{2}, \dots, σ_{M}^{2}

$\sigma_1^2, \ldots, \sigma_M^2$

Я могу вывести это но эта граница кажется очень свободной. Численный тест показывает, что может быть возможным, но я не смог доказать это. Любая помощь приветствуется.

Var (max_{i} X_{i}) \leq \sum_{i} σ_{i}^{2},

$\mbox{Var}(\max_i X_i) \leq \sum_i \sigma_i^2 \enspace,$

B = max_{i} σ_{i}^{2}

$B = \max_i \sigma_i^2$

variance bounds maximum Питер
источник

(Вы хотите предположить, что независимы?) Эта гипотеза правдоподобна, но кажется ложной. Например, проведите несколько испытаний, где идентифицированы с CDF , , . Дисперсия их максимума относительно их общей дисперсии возрастает без ограничения как

X_{i}

$X_i$

X_{i}

$X_i$

1 - x^{1 - s}

$1-x^{1-s}$

1 \leq x \leq \infty

$1\le x\le \infty$

s > 3

$s\gt 3$

M

$M$ роста

whuber

@whuber Спасибо, это объясняет, почему я не смог доказать эту гипотезу :) Меня действительно интересует случай, когда независимы. Просто чтобы уточнить, меня больше всего интересуют общие оценки, которые используют только первые два момента. Я не уверен, существуют ли даже более четкие общие границы, чем общая дисперсия.

X_{i}

$X_i$

Питер

Я должен указать, что ваша оценка суммы (при условии, что она правильная - было бы неплохо увидеть набросок доказательства) является жесткой. Например, пусть

поддерживается на интервале

с дисперсиями, не превышающими

и пусть

поддерживается на

. Тогда

as, с дисперсией

X_{2}, \dots, X_{M}

$X_2,\ldots,X_M$

[- \infty, a]

$[-\infty, a]$

ε^{2}

$\varepsilon^2$

X_{1}

$X_1$

[a, \infty]

$[a,\infty]$

max_{i} X_{i} = X_{1}

$\max_i{X_i}=X_1$

σ_{1}^{2} \leq σ_{1}^{2} + (M - 1) ε^{2}

$\sigma_1^2\le\sigma_1^2+(M-1)\varepsilon^2$ , но неравенство можно ужесточить настолько, насколько вы захотите, уменьшив

ε^{2}

$\varepsilon^2$

whuber

Для данных iid теория экстремальных значений предоставляет классы распределений, к которым сходится максимум выборки, с определенными условиями на хвостах исходных распределений, дающих различные классы асимптотических распределений. Поэтому я сомневаюсь, что вы сможете получить хорошую оценку, основываясь только на двух моментах, хотя я лишь косвенно знаком с этой теорией.

StasK

Ответы:

Для любых случайных величин наилучшей общей оценкой является как указано в исходном вопросе. Вот набросок доказательства: если X, Y - IID, то . Дан вектор возможных зависимых переменных $n$ $X_i$ $\newcommand{\Var}{\mathrm{Var}}\Var(\max X_i) \le \sum_i \Var(X_i)$ $E[(X-Y)^2] =2\Var(X)$ , пусть $(X_1,\ldots ,X_n)$ быть независимым вектором с таким же совместным распределением. Для любого мы имеем по объединенной границе, что , и интегрируя это $(Y_1,\ldots ,Y_n)$ $r>0$ $P[ |\max_i X_i-\max_i Y_i|^2 >r] \le \sum_i P[ | X_i-Y_i|^2 >r]$ от до дает заявленное неравенство. $dr$ $0$ $\infty$

Если являюсь IID индикаторов событий вероятности , то являюсь показателем события вероятности . Зафиксируя и положив стремиться к нулю, мы получаем и $X_i$ $\epsilon$ $\max X_i$ $n\epsilon+O(n^2 \epsilon^2)$ $n$ $\epsilon$ $\Var(X_i)=\epsilon-\epsilon^2$ . $\Var(\max_i X_i)= n\epsilon +O(n^2\epsilon^2)$

Юваль Перес
источник

Вопрос по MathOverflow связан с этим вопросом.

Для случайных величин IID е старшее число называется статистикой порядка . $k$

Даже для случайных величин IID Бернулли дисперсия любой статистики порядка, кроме медианы, может быть больше, чем дисперсия совокупности. Например, если это с вероятностью и с вероятностью и , то максимальное значение с вероятностью , так что дисперсия населения в то время дисперсии максимум составляет около . $X_i$ $1$ $1/10$ $0$ $9/10$ $M=10$ $1$ $\approx 1- 1/e$ $0.09$ $0.23$

Вот две статьи о дисперсиях статистики заказов:

Ян, Х. (1982). «О дисперсиях медианы и некоторых других статистических порядках». Bull. Текущий месяц Математика Акад. Синика, 10 (2) с. 197-204

Пападатос, Н. (1995) "Максимальная дисперсия статистики порядка". Энн. Текущий месяц Statist. Матем., 47 (1) с. 185-193

Я полагаю, что верхняя граница дисперсии максимума во второй статье равна . Они указывают на то, что равенство не может произойти, но может быть любое меньшее значение для случайных величин IID Бернулли. $M\sigma^2$

Дуглас Заре
источник