Скажем, у меня есть образец и образец начальной загрузки из этого образца для стастита (например, среднее значение). Как все мы знаем, эта самозагрузки образец оценивает на распределение выборки из оценки из статистики.
Теперь, является ли среднее значение этой выборки начальной загрузки лучшей оценкой статистики популяции, чем статистика исходной выборки ? При каких условиях это будет иметь место?
estimation
bootstrap
Амелио Васкес-Рейна
источник
источник
Ответы:
Давайте обобщим, чтобы сосредоточиться на сути вопроса. Я изложу мельчайшие детали, чтобы не оставить никаких сомнений. Анализ требует только следующее:
Среднее арифметическое из набора чисел определяется какZ1, … , Zм
Ожидание является линейным оператором. То есть, когда являются случайными переменными и являются числами, то ожидание линейной комбинации является линейной комбинацией ожиданий,α iZя, я = 1 , … , м αя
Пусть - выборка полученная из набора данных путем равномерного взятия элементов из с заменой. Пусть среднее арифметическое из . Это случайная величина. потом( B 1 , … , B k ) x = ( x 1 , … , x n ) k x m ( B ) BВ ( Б1, … , БК) х = ( х1, … , ХN) К Икс м ( б ) В
следует по линейности ожидания. Поскольку все элементы получены одинаковым образом, все они имеют одинаковое ожидание, говорят:bВ б
Это упрощает вышеизложенное
По определению ожидание представляет собой взвешенную по вероятности сумму значений. Поскольку предполагается, что каждое значение имеет равную вероятность выбора ,1 / nИкс 1 / n
среднее арифметическое данных.
Чтобы ответить на вопрос, если кто-то использует среднее значение данных для оценки среднего значения популяции, то среднее значение начальной загрузки (в данном случае ) также равно и, следовательно, является идентичным в качестве оценки среднего значения популяции. , k=n ˉ xИкс¯ k = n Икс¯
Для статистики, которая не является линейной функцией данных, один и тот же результат не обязательно имеет место. Однако было бы неправильно просто подставлять среднее значение начальной загрузки для значения статистики в данных: это не то, как работает начальная загрузка. Вместо этого, сравнивая среднее значение начальной загрузки со статистикой данных, мы получаем информацию о смещении статистики. Это можно использовать для корректировки исходной статистики, чтобы устранить смещение. Таким образом, исправленная смещением оценка, таким образом, становится алгебраической комбинацией исходной статистики и среднего значения начальной загрузки. Для получения дополнительной информации ищите «BCa» (скорректированная смещения и ускоренная начальная загрузка) и «ABC». Википедия предоставляет некоторые ссылки.
источник
источник