Я хотел бы знать разницу между групповым анализом данных и анализом смешанных моделей. Насколько мне известно, как данные панели, так и смешанные модели используют фиксированные и случайные эффекты. Если так, почему у них разные имена? Или они синонимы?
Я прочитал следующий пост, который описывает определение фиксированного, случайного и смешанного эффекта, но точно не отвечает на мой вопрос: в чем разница между моделями с фиксированным, случайным и смешанным эффектами?
Я также был бы признателен, если бы кто-нибудь смог отослать меня к краткой (около 200 страниц) ссылке на анализ смешанной модели. Просто добавлю, что я бы предпочел смешанный справочник по моделированию независимо от программной обработки. Преимущественно теоретическое объяснение смешанного моделирования.
Ответы:
Как данные панели, так и данные модели смешанного эффекта имеют дело с случайными переменными с двойной индексацией . Первый индекс для группы, второй для отдельных лиц в группе. Для панельных данных вторым индексом обычно является время, и предполагается, что мы наблюдаем людей с течением времени. Когда время является вторым индексом для модели со смешанным эффектом, модели называются продольными моделями. Модель смешанного эффекта лучше всего понимается в терминах двухуровневых регрессий. (Для простоты изложения допустим только одну объясняющую переменную)yij
Первый уровень регрессии заключается в следующем
Это просто объясняется как индивидуальная регрессия для каждой группы. Регрессия второго уровня пытается объяснить различия в коэффициентах регрессии:
β i = δ 0 + z i 2 δ 1
Когда вы заменяете второе уравнение на первое, вы получаете
Фиксированные эффекты - это то, что исправлено, это означает, что . Случайные эффекты: и .u iγ0,γ1,δ0,δ1 ui vi
Теперь для панельных данных терминология меняется, но вы все равно можете найти общие точки. Модель случайных эффектов на панели данных аналогична модели смешанных эффектов с
β i
с моделью становится
где - случайные эффекты.ui
Наиболее важным различием между моделью смешанных эффектов и панельными моделями данных является обработка регрессоров . Для моделей со смешанными эффектами они являются неслучайными переменными, тогда как для панельных моделей данных всегда предполагается, что они случайные. Это становится важным при указании модели фиксированных эффектов для данных панели.xij
Для модели смешанного эффекта предполагается, что случайные эффекты и не зависят от а также от и , что всегда верно, когда и фиксированы. Если мы допустим стохастический это становится важным. Таким образом, модель случайных эффектов для данных панели предполагает, что не коррелирует с . Но модель с фиксированным эффектом, которая имеет ту же формуv i ε i j x i j z i x i j z i x i j x i t u iui vi εij xij zi xij zi xij xit ui
позволяет корреляцию и . Тогда акцент делается исключительно на последовательную оценку . Это делается путем вычитания отдельных средств: u i δ 0xit ui δ0
и используя простую OLS для возникающей проблемы регрессии. Алгебраически это совпадает с проблемой регрессии фиктивной переменной наименьших квадратов, где мы предполагаем, что являются фиксированными параметрами. Отсюда и название модели с фиксированными эффектами.ui
В эконометрических данных панели есть много историй, связанных с фиксированными эффектами и терминологией случайных эффектов, которые я пропустил. По моему личному мнению, эти модели лучше всего объясняются в « Эконометрическом анализе данных поперечного сечения и панелей » Вулдриджа . Насколько я знаю, в модели смешанных эффектов такой истории нет, но, с другой стороны, я пришел из эконометрического фона, поэтому могу ошибаться.
источник
Я понимаю, что вы ищете текст, который описывает смешанную теорию моделирования без ссылки на программный пакет.
Я бы порекомендовал многоуровневый анализ, введение в базовое и расширенное многоуровневое моделирование Тома Снидерса и Роела Боскера, около 250 стр. В конце у него есть глава по программному обеспечению (которая несколько устарела), но остальная часть - очень доступная теория.
Я должен сказать, однако, что я согласен с рекомендацией выше для многоуровневых и продольных моделей с использованием Stata Софи Рабе-Хескет и Андерс Скрондал. Книга очень теоретическая, а программный компонент действительно является хорошим дополнением к содержательному тексту. Я обычно не использую Stata, и текст у меня на столе, и я нахожу его очень хорошо написанным. Это однако намного дольше, чем 200pp.
Следующие тексты написаны действующими экспертами в данной области и будут полезны для тех, кто хочет получить больше информации об этих методах (хотя они не соответствуют конкретно вашему запросу): [Я не могу связать их с этим, потому что я новичок пользователь, извините]
Hoox, Joop (2010). Многоуровневый анализ, методы и приложения.
Гельман А. и Хилл Дж. (2006) Анализ данных с использованием регрессионных и многоуровневых / иерархических моделей.
Сингер, Дж. (2003) Прикладной продольный анализ данных: моделирование изменений и возникновения событий
Raudenbush SW и Bryk A., S. (2002). Иерархические линейные модели: приложения и методы анализа данных
Люк, Дуглас, (2004). Многоуровневое моделирование
Я бы также поддержал упомянутый выше текст Вулдриджа, а также текст R, а в Центре многоуровневого моделирования Bistol University есть куча учебных пособий и информации.
источник
Я тоже удивился разнице между ними, и, недавно обнаружив ссылку на эту тему, я понимаю, что «панельные данные» - это традиционное название для наборов данных, которые представляют «сечение или группу людей, которые периодически опрашиваются на протяжении данный промежуток времени ". Таким образом, «панель» - это групповая структура в наборе данных, и наличие такой группы наиболее естественный способ анализа данных этого типа - через смешанный подход.
Хорошим справочником (независимо от того, говорите ли вы R или нет) о моделировании смешанных эффектов является черновик (?) Будущей книги Дугласа Бейтса ( lme4: Моделирование смешанных эффектов с помощью R ).
источник
@mpiktas дал исчерпывающий ответ. Я также хотел бы предложить чтение главы 7 документации для Plm пакета в R . Обсуждение авторов о разнице между смешанными моделями и панельными данными стоит прочитать.
источник
Если вы используете Stata, многоуровневые и продольные модели с использованием Stata от Sophia Rabe-Hesketh и Anders Skrondal были бы хорошим выбором. В зависимости от того, что именно вас интересует, 200 страниц могут быть правильными.
источник
По моему опыту, обоснование использования «эконометрики панели» заключается в том, что оценки «фиксированных эффектов» панели можно использовать для управления различными формами пропущенного переменного смещения.
Тем не менее, можно выполнить этот тип оценки в многоуровневой модели, используя подход типа Мундлака , т.е. включив групповые средства в качестве дополнительных регрессоров. Этот подход устраняет корреляцию между ошибочным членом и потенциальными опущенными факторами на уровне группы, выявляя коэффициент «внутри». Однако по неизвестной мне причине это обычно не делается в прикладных исследованиях. Эти слайды и этот документ обеспечивают разработку.
источник