Во всем мы предполагаем, что наша статистика является функцией некоторых данных которые взяты из функции распределения ; Эмпирическая функция распределения нашей выборки - . Таким образом, - это статистика, рассматриваемая как случайная величина, а - это версия статистики для начальной загрузки. Мы используем в качестве расстояния KSX 1 , ... X п F F & thetas ; ( F ) θ ( F ) d ∞
Существуют «если и только если» результаты для достоверности начальной загрузки, если статистика является простой линейной статистикой. Например, теорема 1 от Маммена "Когда работает бутстрап?"
Если для некоторой произвольной функции то загрузчик работает в том смысле, что если и только если существуют \ sigma_n и t_n такие, что d_ \ infty \ big [\ mathscr {L} (\ theta (F) -t_n), N (0, \ sigma_n ^ 2) \ big] \ underset {p} {\ rightarrow} 0 Где мы можем определить \ hat {t_n} как некоторую функцию нашего образца и t_n = \ mathbb {E} (\ hat {t} _n)чпд∞[L(θ( F ) - т п),L(θ(F)-тп)]→р0σнтпд∞[L(θ(F)-tn)
тн
Есть также более общие результаты, что бутстрап работает для общей статистики, например, теорема 1.6.3 из Subsampling от Politis Romano и Wolf:
Предположим, что взят из класса всех распределений с конечным носителем. Предположим, что статистика дифференцируема по Фреше в относительно нормы супремума, а производная удовлетворяет условию . Тогда асимптотически нормальна, и бутстрап работает в смысле предыдущей теоремы.
Я хотел бы вариант второй теоремы "если и только если". Для этого потребуется понятие гладкости, отличное от дифференцируемости по Фреше, поскольку Politis, Romano and Wolf (1999) показывают, что медиана выборки не дифференцируема по Фреше, но бутстрап все еще работает. Однако медиана выборки все еще является гладкой функцией данных.
В Mammen есть неформальные комментарии о том, что гладкость необходима:
Обычно локальная асимптотическая линейность необходима для согласованности бутстрапа
Цитата должна:
van Zwet, W (1989). Доклад на конференции «Асимптотические методы для компьютерных интенсивных процедур в статистике» в Ольбервольфахе.
Но я не могу найти никаких следов этого разговора, кроме нескольких цитат.
Ответы:
Дифференцируемость по Адамару (или компактная дифференцируемость в зависимости от исходного источника) необходима в качестве достаточного условия, чтобы заставить загрузчик работать в этом случае, медиана и любой квантиль дифференцируемы по Адамару. Дифференцируемость по Фреше слишком сильна в большинстве приложений.
Поскольку обычно достаточно обсудить польское пространство, вы хотите, чтобы локально линейный функционал применял типичный аргумент компактности, чтобы распространить ваш результат согласованности на глобальную ситуацию. Также см. Комментарий по линеаризации ниже.
Теорема 2.27 [Вассермана] даст вам интуитивное представление о том, что производная Адамара является более слабым понятием. А теорема 3.6 и 3.7 из [Shao & Tu] даст достаточное условие слабой согласованности в терминах дифференциации Адамара статистического функционала с размером наблюдения .T n nρ Tn n
[Shao & Tu] pp.85-86 иллюстрирует ситуации, когда может возникнуть несоответствие оценок бутстрапов.
А в разделе 3.5.2 [Шао & Tu] они вновь пример квантиля с помощью сглаживающего ядра . Обратите внимание, что моменты являются линейными функционалами. Цитата в вашем вопросе «Как правило, локальная асимптотическая линейность представляется необходимой для согласованности начальной загрузки» требует некоторого уровня аналитичности функционала, который может быть необходим, поскольку в случае неудачи вы можете создать какой-то патологический случай как функция Вейерштрасса (которая непрерывна, но нигде не дифференцируема).K
Что касается комментария «Обычно локальная асимптотическая линейность представляется необходимой для согласованности начальной загрузки», сделанного Мамменом, как вы упомянули. Комментарий от [Shao & Tu] стр.78 выглядит следующим образом, поскольку они прокомментировали (глобальная) линеаризация - это всего лишь метод, который облегчает доказательство согласованности и не указывает на какую-либо необходимость:
И они привели пример 3.3 получения последовательности начальной загрузки для начальной загрузки типа MLE. Однако если глобальная линейность эффективна таким образом, трудно представить, как можно доказать согласованность без локальной линейности. Так что я думаю, это то, что хотел сказать Маммен.
Помимо обсуждения, представленного [Shao & Tu] выше, я думаю, что вы хотите, чтобы было условие характеризации согласованности оценщиков начальной загрузки.
К сожалению, я не знаю ни одной характеристики согласованности оценки начальной загрузки для очень общего класса распределения в .M(X) Даже если есть одиня чувствуючтотребует не только гладкость. Но существует характеристика для определенного класса статистических моделей, таких какклассв [Gine & Zinn]; или обычно компактно поддерживаемый класс (прямо из обсуждения выше), определенный над польским пространством.T CLT
Кроме того, расстояние Колмогорова-Смирнова, на мой вкус, является неправильным расстоянием, если мы фокусируемся на классической асимптотике (в отличие от «равномерной» асимптотики для эмпирических процессов). Поскольку KS-расстояние не индуцирует слабую топологию, которая является естественным основанием для изучения асимптотического поведения, слабая топология в пространстве индуцируется ограниченным липшицевым расстоянием (OR-расстоянием Прохорова-Леви) в соответствии с [Huber] и многие другие авторы, когда в центре внимания не эмпирический процесс. Иногда в обсуждении ограничивающего поведения эмпирического процесса также участвуют BL-расстояния вроде [Gine & Zinn].M(X)
Я ненавижу быть циничным, но все же чувствую, что это не единственное статистическое письмо, которое «цитируется из пустоты». Сказав это, я просто чувствую, что цитата из выступления ван Звета очень безответственна, хотя ван Звет - великий ученый.
[Вассерман] Вассерман, Ларри. Вся непараметрическая статистика, Springer, 2010.
[Шао и Ту] Шао, Цзюнь и Донгшенг Ту. Складной нож и бутстрап. Springer, 1995.
[Джин и Зинн] Джине, Эварист и Джоэл Зинн. «Начальные эмпирические меры». Анналы вероятности (1990): 851-869.
[Хубер] Хубер, Питер Дж. Надежная статистика. Wiley, 1985.
источник