Простое применение методов начальной загрузки к проверке гипотез состоит в том, чтобы оценить доверительный интервал тестовой статистики , многократно вычисляя его по загрузочным выборкам (пусть статистика взятая из начальной загрузки, называется ). Мы отвергаем если предполагаемый параметр (который обычно равен 0) находится за пределами доверительного интервала . ; & thetas ; ^ & thetas ; * Н0thetas0 ^ & thetas ; *
Я читал, что этому методу не хватает силы. В статье Холла П. и Уилсона С.Р. "Два руководства по проверке гипотезы начальной загрузки" (1992) в качестве первого указывается, что следует пересчитать , а не . И это та часть, которую я не понимаю.^ θ * -θ0
Разве это не измеряет только смещение оценки ? Для объективных оценок доверительные интервалы этого выражения всегда должны быть меньше, чем , но я не понимаю, как это связано с тестированием на ? Я нигде не вижу, чтобы мы поместили информацию о .^ θ * ^ θ * -θ0 θ =θ0θ0
Для тех из вас, у кого нет доступа к этой статье, это цитата из соответствующего абзаца, которая следует сразу после тезиса:
Чтобы понять, почему это важно, обратите внимание, что тест будет включать отклонение если в "слишком большой" Если далеко от истинного значения (т. Если является грубой ошибкой), то разница никогда не будет выглядеть слишком большим по сравнению с непараметрическим распределением начальной загрузки, Более значимое сравнение с распределением, На самом деле, если истинное значение равно| Θ - θ 0 | θ 0 θ H 0 | Θ - θ 0 | | Θ - θ 0 | | ^ Θ * - θ | θ θ 1 | θ 1 - θ 0 | | ^ Θ * - θ | | θ 1 - θ 0 |тогда мощность теста начальной загрузки увеличивается до 1 какувеличивается, если тест основан на повторной выборке , но мощность уменьшается не более чем до уровня значимости (при увеличении ), если тест основан на повторной выборке
источник
ОК, я понял Спасибо, StasK, за такой хороший ответ. Я сделаю так, чтобы другие могли учиться, но в моем конкретном случае я упустил очень простой факт:
Процедура начальной загрузки в соответствии с рекомендациями Холла и Уилсона для простого среднего теста с одной выборкой такова (в псевдокоде, вдохновленном R):
Часть, которую я пропустил, заключалась в том, что был «использован» в строке (где мы установили ссылку ).θθ0 θ^
2
Интересно отметить, что в строке≤ ≥
2
и6
мы могли бы одинаково легко использоватьp.value
вместоstatistic
. В этом случае мы также должны изменить на в строке .≥7
источник