Этот вопрос задавался очень давно, но я публикую ответ на тот случай, если кто-нибудь обнаружит его в будущем. Короче говоря, ответ «да»: вы можете сделать это во многих настройках, и вы можете исправить изменение размера выборки с помощью . Этот подход обычно называют boostrap out of , и он работает в большинстве настроек, как это делает «традиционный» загрузчик, а также в некоторых настройках, в которых он не работает.MN−−√MN
Причина в том, что во многих аргументах согласованности начальной загрузки используются оценщики в форме , где - случайные величины, а - некоторый параметр базовое распределение. Например, для выборочного среднего значения и .1N√(TN−μ)X1,…,XNμTN=1N∑Ni=1Xiμ=E(X1)
Многие доказательства непротиворечивости начальной загрузки утверждают, что, как , учитывая некоторую конечную выборку и связанную оценку точки ,
где взяты из истинного базового распределения, а нарисованы с заменой из .N→∞{x1,…,xN}μ^N=TN(x1,…,xN)N−−√(TN(X∗1,…,X∗N)−μ^N)→DN−−√(TN(X1,…,XN)−μ)(1)
XiX∗i{x1,…,xN}
Однако мы могли бы также использовать более короткие выборки длины и рассмотреть оценщик
Оказывается, что, как и , оценщик ( ) имеет то же предельное распределение, что и выше, в большинстве настроек, где ( ) держит и кое где нет. В этом случае ( ) и ( ) имеют одинаковое предельное распределение, мотивируя поправочный коэффициент например, в стандартном отклонении выборки.M<NM−−√(TM(X∗1,…,X∗M)−μ^N).(2)
M,N→∞2112MN−−√
Все эти аргументы являются асимптотическими и имеют место только в пределе . Чтобы это работало, важно не выбирать слишком маленьким. Существует некоторая теория (например, Биккель и Саков ниже) о том, как выбрать оптимальный как функцию от чтобы получить наилучшие теоретические результаты, но в вашем случае вычислительные ресурсы могут быть решающим фактором.M,N→∞M MN
Для некоторой интуиции: во многих случаях у нас есть как , так что
можно считать немного похожим на из начальной загрузки с и (я использую строчные буквы, чтобы избежать путаницы в обозначениях ). Таким образом, эмуляция распределения ( ) с использованием начальной загрузки из с является более "правильной" вещью, чем традиционная ( изμ^N→DμN→∞N−−√(TN(X1,…,XN)−μ),(3)
mnm=Nn=∞MNM<NNN3MNM<NNN) своего рода. Дополнительным бонусом в вашем случае является то, что это менее затратно для вычислений.
Как вы упомянули, Политис и Романо - основная статья. Я нахожу Bickel et al (1997) под хорошим обзором бутстрапа изMN
Источники :
PJ Bickel, F Goetze, WR van Zwet. 1997. Повторная выборка менее чем наблюдений: выгоды, потери и средства защиты от потерь. Statistica Sinica.n
PJ Bickel, A Sakov. 2008. О выборе в nuf из начальной загрузки и доверительных границ для экстремумов. Statistica Sinica.mmn