Часто утверждается, что начальная загрузка может дать оценку смещения в оценщике.
Если т является оценкой для некоторой статистики, и ~ т я являюсь бутстраповскими репликами (с I ∈ { 1 , ⋯ , N } ), то оценкой смещения начальной загрузки является б я ы т ≈ -
Я не могу понять, как это возможно, если у меня уже нет объективной оценки статистики. Например, если мой оценщик просто возвращает константу, которая не зависит от наблюдений, приведенная выше оценка смещения явно недействительна.
Хотя этот пример является патологическим, я не могу понять, каковы разумные предположения об оценке и распределениях, которые гарантируют, что оценка начальной загрузки является разумной.
Я пытался читать формальные ссылки, но я не статистик и не математик, поэтому ничего не разъяснилось.
Может ли кто-нибудь предоставить сводную информацию о том, когда оценка может быть действительной? Если вы знаете о хороших ссылках на эту тему, это также было бы здорово.
Редактировать:
Плавность оценки часто указывается в качестве требования для работы начальной загрузки. Может ли быть так, что также требуется какая-то локальная обратимость преобразования? Карта констант явно не удовлетворяет этому.
Ответы:
Проблема, которую вы описываете, - это проблема интерпретации, а не обоснованности. Оценка смещения начальной загрузки для вашей постоянной оценки не является недействительной, она фактически идеальна.
Оценка самозагрузки смещения между блоком оценки thetas ; = евыми ( х ) и параметр θ = т ( Р ) , где Р некоторым неизвестным распределением и х образцами из F . Функция t ( F ) - это то, что вы могли бы в принципе рассчитать, если бы у вас было население. Несколько раз мы берем s ( х ) = т ( F ) , плагин оценки т (θ^=s(x) θ=t(F), F x F t(F) s(x)=t(F^), с помощью эмпирического распределения F в месте F . Вероятно, это то, что вы описали выше. Во всех случаях оценка самозагрузки смещения является
б я ев Р = Е Р [ с ( х * ) ] - т ( Р ) ,
где х * являются бутстраповскими образцами от й .t(F) F^ F
Константа является идеальным плагиной оценкой для тех же констант:с население и образец ~ Р , эмпирическое распределение, которая приблизительно равна F . Если бы вы могли оценить t ( F ) = c , вы бы получили c . Когда вы вычисляете плагин оценки т ( F ) = C вы также получаете гр . Нет предвзятости, как и следовало ожидать.∼ F ∼ F^ F т ( Ф) = с с т ( Ф^) = с с
Хорошо известный случай , когда есть уклон в плагин оценки находится в оценке дисперсии, следовательно , коррекция Бесселя. Ниже я продемонстрирую это. Оценка смещения начальной загрузки не так уж и плоха:т ( Ф^)
Вместо этого мы могли бы взять в качестве среднего значения для населения и s ( x ) = c , ситуацию, в которой в большинстве случаев должно быть явное смещение:т ( Ф) s ( x ) = c
Опять же, оценка начальной загрузки не так уж и плоха.
источник
Вы делаете одну ошибку, и, возможно, именно поэтому это сбивает с толку. Ты говоришь:
Bootstrap не о том, насколько смещен ваш метод, а о том, насколько ваши результаты получены какой-либо функцией, учитывая, что ваши данные смещены.
Если вы выберете соответствующий статистический метод для анализа ваших данных, и все предположения этого метода будут выполнены, и вы правильно сделали математику, то ваш статистический метод должен предоставить вам «наилучшую» возможную оценку, которая может быть получена с использованием ваших данных .
Идея начальной загрузки состоит в том, чтобы производить выборку из ваших данных так же, как вы делали выборку по вашим случаям из совокупности - так что это своего рода репликация вашей выборки. Это позволяет вам получить приблизительное распределение (используя слова Эфронса) вашего значения и, следовательно, оценить отклонения вашей оценки.
Однако я утверждаю, что ваш пример вводит в заблуждение и поэтому это не лучший пример для обсуждения начальной загрузки. Поскольку с обеих сторон были недоразумения, позвольте мне обновить мой ответ и написать его более формально, чтобы проиллюстрировать мою точку зрения.
Смещение по & thetas оценок истинного значения & thetas определяются как:θ^ θ
где:
Как отмечает Ларри Вассерман в своей книге «Вся статистика» :
источник
Вы хотите использовать фактическую статистику, оцененную по эмпирическому распределению (это часто легко, поскольку исходная выборка представляет собой конечный набор), а не оценку. В некоторых случаях они могут быть одинаковыми (например, среднее эмпирическое значение совпадает со средним по выборке), но в целом они не будут. Вы привели один случай, когда они различаются, но менее патологическим примером является обычный несмещенный оценщик для дисперсии, который отличается от дисперсии совокупности при применении к конечному распределению.
TL / DR: метод начальной загрузки не является магическим. Чтобы получить беспристрастную оценку смещения, вы должны быть в состоянии вычислить интересующий параметр точно на конечном распределении.
источник
Я считаю полезным думать о процедурах начальной загрузки с точки зрения функционалов распределений, над которыми они работают - в этом ответе я привел пример другого вопроса о начальной загрузке.
Оценка, которую вы дали, это то, что она есть - оценка. Никто не говорит, что это не страдает от проблем, которые могут иметь статистические оценки. Это даст вам ненулевую оценку смещения, например, для выборочного среднего, которое, как мы все знаем, беспристрастно с самого начала. Одна проблема с этим оценщиком смещения состоит в том, что он страдает от изменчивости выборки, когда бутстрап реализован как Монте-Карло, а не от полного перечисления всех возможных подвыборок (и ни у кого этот теоретический бутстреп на практике, во всяком случае).
Таким образом, реализация начальной загрузки в Монте-Карло является нефиксированной, и вам придется использовать другую схему начальной загрузки. Davison et. и др. (1986) продемонстрировали, как создать другую схему начальной загрузки, которая ограничивает случайные ничьи для получения сбалансированных выборок: если вы создаетеВ загрузочный реплицируется, тогда каждый из оригинальных элементов должен быть использован точно В раз для баланса первого порядка. (Баланс второго порядка, который лучше работает для вторых моментов оценок, дополнительно обсуждается Грэмом и др. (1990) .)
источник