Кластерные стандартные ошибки против многоуровневого моделирования?

18

Я пролистал несколько книг (Raudenbush & Bryk, Snijders & Bosker, Gelman & Hill и т. Д.) И несколько статей (Gelman, Jusko, Primo & Jacobsmeier и т. Д.), И я до сих пор не успокоился основные различия между использованием кластерных стандартных ошибок стихов многоуровневого моделирования.

Я понимаю те части, которые связаны с вопросом исследования под рукой; Есть определенные типы ответов, которые вы можете получить только при многоуровневом моделировании. Однако, например, для двухуровневой модели, где ваши коэффициенты интереса находятся только на втором уровне, в чем преимущество одного метода перед другим? В этом случае я не беспокоюсь о том, чтобы делать прогнозы или извлекать отдельные коэффициенты для кластеров.

Основное различие, которое мне удалось обнаружить, заключается в том, что кластерные стандартные ошибки страдают, когда кластеры имеют неравные размеры выборки, и что многоуровневое моделирование слабо в том смысле, что оно предполагает спецификацию распределения случайных коэффициентов (тогда как использование кластерных стандартных ошибок не имеет модели) ,

И в конце концов, означает ли все это, что для моделей, которые якобы могут использовать любой из этих методов, мы должны получить аналогичные результаты с точки зрения коэффициентов и стандартных ошибок?

Любые ответы или полезные ресурсы будут с благодарностью.

RickyB
источник
6
Пользователь Stask имеет хороший ответ именно на этот вопрос .
Энди W
Благодарю. Я читал это раньше, что на самом деле заставило меня скептически относиться к реальным преимуществам. Тем не менее, я полагаю, что реальная мотивация моего вопроса заключается в том, чтобы убедиться в том, что я полностью оправдан, думая, что это не слишком полезно, если я рассматриваю только коэффициенты второго уровня как представляющие интерес. Кроме того, возможно, я пропустил это, но я не думаю, что этот пост посвящен тому, должны ли эти два метода давать одинаковые результаты (когда выполняются предположения обоих методов).
RickyB
1
Под «коэффициентами на втором уровне» вы подразумеваете уровень, на котором вы указали параметры первого этапа в качестве зависимых переменных?
15:30
Да, это то, что я имею в виду.
RickyB

Ответы:

1

Этот пост основан на личном опыте, который может быть связан с моими данными, поэтому я не уверен, что это может быть ответом.

Я предлагаю использовать симуляции, если это возможно, чтобы оценить, какой метод лучше всего подходит для ваших данных. Я сделал это и с удивлением обнаружил, что тесты (относительно параметров на первом уровне), основанные на многоуровневом моделировании, превосходили любой другой метод (по мощности), сохраняя при этом размер даже в небольших выборках с небольшим количеством кластеров неравномерного размера. Мне еще предстоит найти документ, который подчеркивает это, и, насколько я понимаю, это не является нишевой темой и заслуживает большего внимания. Я думаю, что недостаточно изучено, как различные методы сравнивают с конечной выборкой или несколькими / неравномерными кластерами.

SHESS
источник
Спасибо за ваш комментарий. У вас есть документ, в который вы записали свои результаты? Мне было бы очень интересно посмотреть на это и увидеть то, что вы нашли (и, конечно, я не стал бы цитировать, делиться или улучшать это, не обсуждая это с вами).
RickyB