Я пролистал несколько книг (Raudenbush & Bryk, Snijders & Bosker, Gelman & Hill и т. Д.) И несколько статей (Gelman, Jusko, Primo & Jacobsmeier и т. Д.), И я до сих пор не успокоился основные различия между использованием кластерных стандартных ошибок стихов многоуровневого моделирования.
Я понимаю те части, которые связаны с вопросом исследования под рукой; Есть определенные типы ответов, которые вы можете получить только при многоуровневом моделировании. Однако, например, для двухуровневой модели, где ваши коэффициенты интереса находятся только на втором уровне, в чем преимущество одного метода перед другим? В этом случае я не беспокоюсь о том, чтобы делать прогнозы или извлекать отдельные коэффициенты для кластеров.
Основное различие, которое мне удалось обнаружить, заключается в том, что кластерные стандартные ошибки страдают, когда кластеры имеют неравные размеры выборки, и что многоуровневое моделирование слабо в том смысле, что оно предполагает спецификацию распределения случайных коэффициентов (тогда как использование кластерных стандартных ошибок не имеет модели) ,
И в конце концов, означает ли все это, что для моделей, которые якобы могут использовать любой из этих методов, мы должны получить аналогичные результаты с точки зрения коэффициентов и стандартных ошибок?
Любые ответы или полезные ресурсы будут с благодарностью.
Ответы:
Этот пост основан на личном опыте, который может быть связан с моими данными, поэтому я не уверен, что это может быть ответом.
Я предлагаю использовать симуляции, если это возможно, чтобы оценить, какой метод лучше всего подходит для ваших данных. Я сделал это и с удивлением обнаружил, что тесты (относительно параметров на первом уровне), основанные на многоуровневом моделировании, превосходили любой другой метод (по мощности), сохраняя при этом размер даже в небольших выборках с небольшим количеством кластеров неравномерного размера. Мне еще предстоит найти документ, который подчеркивает это, и, насколько я понимаю, это не является нишевой темой и заслуживает большего внимания. Я думаю, что недостаточно изучено, как различные методы сравнивают с конечной выборкой или несколькими / неравномерными кластерами.
источник