Пусть - последовательность случайных величин iid, взятых из альфа-стабильного распределения , с параметрами .
Теперь рассмотрим последовательность , где , для .
Я хочу оценить процентиль.
Моя идея - выполнить симуляцию Монте-Карло:
l = 1;
while(l < max_iterations)
{
Generate $X_1, X_2, \ldots, X_{3n}$ and compute $Y_1, Y_2, \ldots, Y_{n}$;
Compute $0.01-$percentile of current repetition;
Compute mean $0.01-$percentile of all the iterations performed;
Compute variance of $0.01-$percentile of all the iterations performed;
Calculate confidence interval for the estimate of the $0.01-$percentile;
if(confidence interval is small enough)
break;
}
Вызов средних весь образца процентили вычислено быть μ п и их дисперсия σ 2 п , вычислить соответствующий доверительный интервал для ц , я прибегаю к сильной форме центральной предельной теоремы :
Пусть - последовательность iid случайных величин с E [ X i ] = μ и 0 < V [ X i ] = σ 2 < ∞ . Определение выборочного среднего как ц п = ( 1 / п ) Е п я = 1 X я . Тогда, ( μ п - μ ) / имеет предельное стандартное нормальное распределение, т.е. μ п -М
и теорема Слуткси, заключающая, что
Тогда доверительный интервал для μ равен
где z 1 - α / 2 -(1-α / 2)-квентиль стандартного нормального распределения.
Вопросов:
1) мой подход правильный? Как я могу обосновать применение CLT? Я имею в виду, как я могу показать, что дисперсия конечна? (Должен ли я смотреть на дисперсию ? Потому что я не думаю, что она конечна ...)
2) Как я могу показать , что в среднем всего образца процентили вычислено сходится к истинному значению 0,01 - процентиля? (Я должен использовать статистику заказов, но я не уверен, как поступить; ссылки приветствуются.)
Ответы:
Дисперсия не конечна.Y Это происходит потому , что альфа-устойчивого переменные с & alpha ; = 3 / 2 (с распределением Хольцмарки ) не имеет конечный математическое ожидание М , но его дисперсия бесконечна. Если бы Y имел конечную дисперсию σ 2 , то, используя независимость X i и определение дисперсии, мы могли бы вычислитьX α=3/2 μ Y σ2 Xi
Это кубическое уравнение вVar(X) имеет по крайней мере одно реальное решение (и до трех решений, но не более), подразумевая, что будет конечным - но это не так. Это противоречие доказывает утверждение.Var(X)
Давайте обратимся ко второму вопросу.
Любой квантиль выборки сходится к истинному квантилю по мере роста выборки. Следующие несколько параграфов подтверждают эту общую мысль.
Пусть соответствующая вероятность будет (или любое другое значение от 0 до 1 , исключая). Напишите F для функции распределения, так что Z q = F - 1 ( qq=0.01 0 1 F был q- м квантилем.Zq=F−1(q) qth
Все, что нам нужно предположить, это то, что (квантильная функция) непрерывна. Это гарантирует нам, что для любого ϵ > 0 существуют вероятности q - < q и q + > q, для которыхF−1 ϵ>0 q−<q q+>q
и что при предел интервала [ q - , q + ] равен { q } .ϵ→0 [q−,q+] {q}
Рассмотрим любой образец iid размера . Число элементов этого образца, которые меньше, чем Z q -, имеет биномиальное ( q - , n ) распределение, потому что каждый элемент независимо имеет шанс q - быть меньше, чем Z q - . Центральная предельная теорема (! Обычная одна) следует , что при достаточно большому п , число элементов менее Z ц - задаются нормальным распределением со средним п д - и дисперсией п д - (n Zq− (q−,n) q− Zq− n Zq− nq− (в сколь угодно хорошем приближении). Пусть CDF стандартного нормального распределения будет Φ . Следовательно, вероятность того, что эта величина превышает n q, сколь угодно близка кnq−(1−q−) Φ nq
Поскольку аргумент на в правой части является фиксированным кратным √Φ , оно растет сколь угодно большим с ростомn. ПосколькуΦявляется CDF, его значение приближается произвольно близко к1, показывая, что предельное значение этой вероятности равно нулю.n−−√ n Φ 1
источник