Почему при начальной загрузке остатков из модели смешанных эффектов получаются антиконсервативные доверительные интервалы?

11

Я обычно имею дело с данными, в которых несколько человек измеряются несколько раз в каждом из двух или более состояний. Недавно я играл с моделированием смешанных эффектов, чтобы оценить доказательства различий между условиями, моделируя individualкак случайный эффект. Чтобы визуализировать неопределенность в отношении прогнозов из такого моделирования, я использовал начальную загрузку, где на каждой итерации начальной загрузки как индивидуумы, так и наблюдения в пределах условий внутри индивидуумов отбираются с заменой, и новая модель смешанного эффекта вычисляется, из которой прогнозы получены. Это прекрасно работает для данных, которые предполагают гауссовскую ошибку, но когда данные являются биномиальными, начальная загрузка может занять очень много времени, потому что каждая итерация должна вычислять сравнительно интенсивную модель биномиальных смешанных эффектов.

У меня была мысль, что я мог бы использовать остатки из исходной модели, а затем использовать эти остатки вместо необработанных данных при начальной загрузке, что позволило бы мне вычислять модель смешанного эффекта Гаусса на каждой итерации начальной загрузки. Добавление исходных прогнозов из биномиальной модели необработанных данных к загрузочным прогнозам из остатков дает 95% -й доверительный интервал для исходных прогнозов.

Тем не менее, я недавно кодировал простую оценку этого подхода, моделируя разницу между двумя условиями и вычисляя долю случаев, когда 95% доверительный интервал не включал ноль, и я обнаружил, что описанная выше процедура начальной загрузки на основе остатков дает довольно сильные консервативные интервалы (они исключают ноль более 5% времени). Кроме того, я затем закодировал (по той же ссылке, что и предыдущий) аналогичную оценку этого подхода применительно к данным, которые изначально были гауссовскими, и он получил аналогичные (хотя и не экстремальные) антиконсервативные КИ. Есть идеи, почему это может быть?

Майк Лоуренс
источник
хм, я только что заметил, что в коде генерации данных для обоих случаев я фактически не добавил никакой изменчивости между индивидуумами, которую обычно интересует устранение, моделируя людей как случайные эффекты. Я посмотрю, если добавление этой изменчивости изменит результат; назад через несколько часов ...
Майк Лоуренс
Если я правильно помню, начальная загрузка делает оценку ближе к истинной оценке населения. Это ничего не говорит о доверительном интервале. (ср. Кесар Сингх. Об асимптотической точности бутстрапа Эфрона. Ann. Statist., 1981, 9, 1187-1195)
suncoolsu
@me: Я могу подтвердить, что добавление изменчивости между людьми в функцию генерации данных не улучшает производительность начальной загрузки. Я загрузил код, который использовал, чтобы подтвердить это, к сути, указанной в оригинальном сообщении.
Майк Лоуренс
@suncoolsu: Я уверен, что доверительные интервалы уже давно были стандартными. Эфрон упоминает их в своей статье 1978 года, в которой описывается процедура начальной загрузки в целом, а затем в 80-х и 90-х годах у него было несколько работ по настройке процедуры начальной загрузки для более точных доверительных интервалов (коррекция смещения, ускорение, изучение и т. Д.).
Майк Лоуренс
1
Вы читали следующую статью Морриса: «BLUP не самые лучшие, когда дело доходит до начальной загрузки». Это может относиться к вашей работе. ссылка
Джулиет

Ответы:

7

Помните, что все доверительные интервалы начальной загрузки являются асимптотически только при заявленном уровне достоверности. Существует также множество возможных методов выбора доверительных интервалов начальной загрузки. Метод процентиля Эфрона, метод процентили Холла, двойной начальной загрузки, начальной загрузки t, наклонной начальной загрузки, BC, BCa и, возможно, еще несколько. Вы не сказали нам, какой метод вы используете. Бумага Шенкера в JASA 1985 показала, что для определенных распределений хи-квадрат доверительный интервал начальной загрузки BC недооценивал рекламируемый процент. При небольших размерах выборки эта проблема может быть серьезной. LaBudde и я имеем две работы, показывающие, как в небольших выборках даже BCa может иметь очень слабое покрытие при оценке отклонения от логнормального распределения, и существует аналогичная проблема для проверки равенства двух дисперсий. Это просто для простой проблемы. Я ожидаю, что то же самое может случиться с остатками от смешанных моделей. В нашей новой книге «Введение в методы начальной загрузки с приложениями к R», опубликованной Wiley в 2011 году, мы освещаем эту тему в разделе 3.7 и даем ссылки. Сюрпризом является то, что метод процентилей иногда работает лучше, чем метод BCa более высокого порядка, когда размер выборки невелик.

Майкл Р. Черник
источник