У меня есть вопрос, касающийся интерпретации вызова tsboot в R. Я проверил документацию как Kendall, так и загрузочного пакета, но я не умнее, чем раньше.
Когда я запускаю бутстрап, используя, например, пример из пакета Kendall, где статистикой теста является тау Кендалла:
library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)
что подтверждает тенденцию к росту:
tau = 0.265, 2-sided pvalue =0.00029206
Затем в примере продолжает использоваться блок начальной загрузки:
#
#Use block bootstrap
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")
Я получаю следующий результат:
BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5,
sim = "fixed")
Bootstrap Statistics :
original bias std. error
t1* 0.2645801 -0.2670514 0.09270585
Если я правильно понимаю, «t1 * original» - это исходный MKtau, «bias» - это среднее значение MKtau из загруженного временного ряда R = 500, а «std. Error» - стандартное отклонение MKtaus от 500 образцов.
Мне трудно понять, что это значит - это в основном говорит мне, что все 500 MKTaus ниже, чем оригинал, и что исходный t1 * находится в диапазоне 3 sd загрузочного MKtaus. Эрго это существенно отличается?
Или я бы сказал, что MKtau для набора данных составляет 0,26 плюс / минус стандартная ошибка?
Я прошу прощения за длинный вопрос, но я новичок в статистике и учусь через самообучение, и мне не хватает кого-то, с кем можно было бы справиться с этой, вероятно, очень простой проблемой.
bias
просто разница между средним значением 500 сохраненных образцов начальной загрузки и исходной оценкой. Этоstd. error
стандартное отклонение 500 выборок начальной загрузки и оценка стандартной ошибки. Выходные данные говорят вам, что ваша первоначальная оценка выше, чем среднее значение из 500 загрузочных оценок (поэтому не все загрузочные MKtaus ниже). Бутстрап часто используется для расчета стандартных ошибок / доверительных интервалов, не делая предположений о распределении. Используйтеboot.ci
функцию для расчета доверительных интервалов.boot.ci
для вычисления доверительных интервалов, и снова, первоначально вычисленная статистика лежит вне этих интервалов.Ответы:
Столкнувшись с тем же вопросом и изучив его с помощью управляемого набора данных - модель y = ax + b с ошибками N (0, sig), я обнаружил, что пакет Kendall может работать не так, как объявлено. Х в моем случае было
1:100
, а у = х , с сиг = 100 (дисперсия ошибки термина).Регрессия выглядит хорошо, как и та Кендалла. Здесь нет автокорреляции, кроме индуцированной линейной моделью. Выполнение теста Кендалла, объявленного с длинами блоков 1, 3, 5 и 10, приводит к очень большим значениям смещения и не
boot.ci
сообщает о тенденции.Впоследствии я вручную запрограммировал загрузчик данных с этими длинами блоков, и с моими контрольными рядами я получил разумные результаты относительно среднего значения выборок загрузчика и их разброса. Следовательно, возможно, что с пакетом Kendall что-то пошло не так в отношении начальной загрузки блока.
источник