Если в стандартных регрессиях OLS нарушаются два предположения (нормальное распределение ошибок, гомоскедастичность), является ли начальная загрузка стандартных ошибок и доверительных интервалов подходящей альтернативой для получения значимых результатов в отношении значимости коэффициентов регрессора?
Тесты значимости с загруженными стандартными ошибками и доверительными интервалами все еще работают с гетероскедастичностью?
Если да, то какие будут применяться доверительные интервалы, которые можно использовать в этом сценарии (процентиль, BC, BCA)?
Наконец, если в этом сценарии уместна начальная загрузка, какую литературу необходимо прочитать и процитировать, чтобы прийти к такому выводу? Любая подсказка будет принята с благодарностью!
Ответы:
Существует как минимум три (может быть и больше) подхода к выполнению начальной загрузки для линейной регрессии с независимыми, но не одинаково распределенными данными. (Если у вас есть другие нарушения «стандартных» допущений, например, из-за автокорреляции с данными временных рядов или кластеризации из-за дизайна выборки, все становится еще сложнее).
Конечная ссылка - Ву (1986) , но Анналы не совсем читают книжки с картинками.
ОБНОВЛЕНИЯ на основе последующих вопросов ФП, заданных в комментариях:
Количество повторов показалось мне большим; единственное хорошее обсуждение этого параметра начальной загрузки, о котором я знаю, находится в книге Efron & Tibshirani's Intro to Bootstrap .
источник
reps(2500)
вероятно, излишнее, по крайней мере, для стандартных ошибок; Я думаю, чтоreps(500)
это нормально для большинства практических целей. Во вступительной книге Эфрона и Тибширани есть раздел о количестве копий. У них также есть целая глава по регрессии, так что это может быть еще одним хорошим справочным материалом для вас.robust
опцию вашей регрессии.est store
и результаты, иest tab, se
их сравнивать бок о бок.