В чем разница между моделями с фиксированным, случайным и смешанным эффектами?

269

Проще говоря, как бы вы объяснили (возможно, простыми примерами) разницу между моделями с фиксированным, случайным и смешанным эффектами?

Андрей
источник
4
Я также считаю, что иногда трудно определить, когда эффект должен рассматриваться как фиксированный или случайный эффект. Хотя есть некоторые рекомендации по этому факту, не всегда легко принять правильное решение.
Мануэль Рамон
3
Я думаю, что эта ссылка может быть полезна для разъяснения основополагающих принципов смешанных моделей: фиксированных, случайных и смешанных моделей (документация SAS) .
pietrop
6
Здесь также можно найти чрезвычайно полезный ответ: в чем разница между случайными эффектами, смешанными эффектами и предельной моделью?
gung

Ответы:

146

Статистик Эндрю Гельман говорит, что термины «фиксированный эффект» и «случайный эффект» имеют различные значения в зависимости от того, кто их использует. Возможно, вы сможете выбрать, какое из 5 определений применимо к вашему делу. В целом, может быть лучше поискать уравнения, описывающие вероятностную модель, которую используют авторы (при чтении), или выписать полную вероятностную модель, которую вы хотите использовать (при написании).

Здесь мы выделяем пять определений, которые мы видели:

  1. Фиксированные эффекты постоянны у разных людей, а случайные эффекты различаются. Например, в исследовании роста модель со случайными перехватами и фиксированным наклоном соответствует параллельным линиям для разных индивидуумов или модели . Таким образом, Kreft и De Leeuw (1998) различают фиксированные и случайные коэффициенты. b i y i t = a i + b taibiyit=ai+bt

  2. Эффекты фиксируются, если они интересны сами по себе или случайны, если есть интерес к основной популяции. Сирл, Казелла и МакКаллох (1992, раздел 1.4) глубоко исследуют это различие.

  3. «Когда выборка исчерпывает совокупность, соответствующая переменная фиксируется; когда выборка является небольшой (то есть незначительной) частью популяции, соответствующая переменная является случайной ». (Green and Tukey, 1960)

  4. «Если предполагается, что эффект является реализованным значением случайной величины, это называется случайным эффектом». (LaMotte, 1983)

  5. Фиксированные эффекты оцениваются с использованием метода наименьших квадратов (или, в более общем смысле, максимальной вероятности), а случайные эффекты оцениваются с усадкой («линейное непредвзятое предсказание» в терминологии Робинсона, 1991). Это определение является стандартным в литературе по многоуровневому моделированию (см., Например, Snijders and Bosker, 1999, раздел 4.2) и в эконометрике.

[ Гельман, 2004, Дисперсионный анализ - почему это важнее, чем когда-либо. Летопись статистики. ]

Джон Сальватье
источник
4
+1: очень хорошая ссылка! Я думаю, что определение также варьируется в зависимости от области (например, № 4 является очень математическим / статистическим, но № 1 и № 2 более «понятны» с точки зрения науки о жизни)
Нико
12
Также полезно прочитать Обсуждение и Возражение к этой статье. В ходе обсуждения Питер Маккаллах написал, что он не согласен с существенной частью того, что написал Гельман. Моя точка зрения заключается не в том, чтобы отдать предпочтение одному или другому, а в том, что между экспертами существуют существенные разногласия, и не придавать слишком большого значения одной бумаге.
Джульет
6
Все обсуждение по ссылке
Джулиет
36
Забавно, что Эндрю Гельман описан как «блоггер», а не как один из ведущих статистиков в мире сегодня. Хотя он, конечно, блоггер, его, вероятно, следует назвать «Статистик Эндрю Гельман», если использовать какой-либо определитель.
Brash Equilibrium
4
Но как статистик, а не просто модный блогер, он должен был бы указать хотя бы субъективные относительные частоты использования пяти случаев. Когда люди говорят о фиксированных эффектах против случайных эффектов, они в большинстве случаев имеют в виду:(4) “If an effect is assumed to be a realized value of a random variable, it is called a random effect.” (LaMotte, 1983)
Ufos
253

Есть хорошие книги на эту тему, такие как Гельман и Хилл . Далее следует краткое изложение их точки зрения.

Прежде всего, вы не должны слишком увлекаться терминологией. В статистике жаргон никогда не должен использоваться вместо математического понимания самих моделей. Это особенно верно для моделей со случайными и смешанными эффектами. «Смешанный» означает, что модель имеет как фиксированные, так и случайные эффекты, поэтому давайте сосредоточимся на разнице между фиксированным и случайным.

Случайные и фиксированные эффекты

Допустим, у вас есть модель с категориальным предиктором, которая делит ваши наблюдения на группы в соответствии со значениями категории. * Коэффициенты модели, или «эффекты», связанные с этим предиктором, могут быть либо фиксированными, либо случайными. Наиболее важное практическое различие между ними заключается в следующем:

Случайные эффекты оцениваются с помощью частичного объединения, а фиксированные - нет.

Частичное объединение означает, что, если у вас мало точек данных в группе, оценка эффекта группы будет частично основана на более обильных данных из других групп. Это может быть хорошим компромиссом между оценкой эффекта путем полного объединения всех групп, которые маскируют изменения на уровне группы, и оценкой эффекта для всех групп совершенно отдельно, что может дать плохие оценки для групп с низкой выборкой.

Случайные эффекты - это просто расширение метода частичного объединения как статистической модели общего назначения. Это обеспечивает принципиальное применение идеи в самых разных ситуациях, включая множественные предикторы, смешанные непрерывные и категориальные переменные и сложные корреляционные структуры. (Но с большой силой приходит большая ответственность: сложность моделирования и умозаключений существенно возрастает, и может привести к тонким предубеждениям , которых необходимо избегать.)

Чтобы мотивировать модель случайных эффектов, спросите себя: зачем вам частичный пул? Возможно, потому что вы думаете, что маленькие подгруппы являются частью какой-то большой группы с общим средним эффектом. Средство подгруппы может немного отличаться от среднего значения большой группы, но не на произвольную величину. Чтобы формализовать эту идею, мы предполагаем, что отклонения следуют распределению, обычно гауссовскому. Вот тут и возникает «случайный» случайный эффект: мы предполагаем, что отклонения подгрупп от родителя следуют распределению случайной величины. Как только вы поймете эту идею, уравнения модели смешанных эффектов будут следовать естественным образом.

К сожалению, пользователи моделей со смешанными эффектами часто имеют ложные представления о том, что такое случайные эффекты и чем они отличаются от фиксированных эффектов. Люди слышат «случайный» и думают, что это означает что-то особенное в моделируемой системе, например, фиксированные эффекты должны использоваться, когда что-то «фиксировано», в то время как случайные эффекты должны использоваться, когда что-то «случайно выбирается». Но нет ничего особенно случайного в предположении, что коэффициенты модели получены из распределения; это просто мягкое ограничение, подобное применяемому к коэффициентам модели в регрессии гребня. Есть много ситуаций, когда вы можете или не хотите использовать случайные эффекты, и они не обязательно имеют много общего с различием между «фиксированным» и «случайным»2

К сожалению, путаница в понятии, вызванная этими терминами, привела к изобилию противоречивых определений . Из пяти определений по этой ссылке только № 4 является полностью правильным в общем случае, но это также совершенно неинформативно. Вы должны прочитать целые статьи и книги (или, если не так, этот пост), чтобы понять, что это определение подразумевает в практической работе.

пример

Давайте рассмотрим случай, когда моделирование случайных эффектов может быть полезным. Предположим, вы хотите оценить средний доход домохозяйства в США по почтовому индексу. У вас есть большой набор данных, содержащий наблюдения за доходами домохозяйств и почтовые индексы. Некоторые почтовые индексы хорошо представлены в наборе данных, но другие имеют только пару домохозяйств.

Для вашей первоначальной модели вы, скорее всего, взяли бы средний доход в каждом ZIP. Это будет хорошо работать, когда у вас есть много данных для ZIP, но оценки для ваших плохо выбранных ZIP-архивов будут сильно отличаться. Вы можете смягчить это с помощью оценки усадки (так называемый частичный пул), которая будет выдвигать экстремальные значения к среднему доходу по всем почтовым индексам.

Но какую усадку / пул вы должны сделать для определенного ZIP? Интуитивно, это должно зависеть от следующего:

  1. Сколько наблюдений у вас в этом ZIP
  2. Сколько наблюдений у вас есть в целом
  3. На индивидуальный уровень , среднее значение и дисперсия доходов домохозяйств во всех почтовых индексах
  4. Группа уровня дисперсии среднего дохода домохозяйств во всех почтовых индексов

Если вы моделируете почтовый индекс как случайный эффект, оценка среднего дохода во всех почтовых индексах будет подвергаться статистически обоснованному сокращению с учетом всех вышеупомянутых факторов.

Самое приятное то, что модели случайных и смешанных эффектов автоматически обрабатывают (4) оценку изменчивости для всех случайных эффектов в модели. Это сложнее, чем кажется на первый взгляд: вы можете попробовать дисперсию среднего значения выборки для каждого ZIP, но это будет предвзятым показателем, потому что некоторая разница между оценками для разных ZIP является просто дисперсией выборки. В модели случайных эффектов процесс вывода учитывает дисперсию выборки и соответственно уменьшает оценку дисперсии.

С учетом (1) - (4) модель случайных / смешанных эффектов способна определить подходящую усадку для групп с низкой выборкой. Он также может обрабатывать гораздо более сложные модели с множеством различных предикторов.

Связь с иерархическим байесовским моделированием

Если для вас это звучит как иерархическое байесовское моделирование, вы правы - это близкий родственник, но не тождественный. Модели смешанных эффектов являются иерархическими в том смысле, что они определяют распределения для скрытых ненаблюдаемых параметров, но обычно они не являются полностью байесовскими, поскольку гиперпараметрам верхнего уровня не будут даны надлежащие априорные значения. Например, в приведенном выше примере мы, скорее всего, будем рассматривать средний доход в данном ZIP как образец из нормального распределения с неизвестным средним значением и сигмой, которые будут оцениваться с помощью процесса подбора смешанных эффектов. Тем не менее, (не байесовская) модель смешанных эффектов, как правило, не имеет предшествующего значения неизвестного среднего и сигмы, поэтому она не является полностью байесовской. При этом при наличии набора данных приличного размера стандартная модель смешанных эффектов и полностью байесовский вариант часто дают очень похожие результаты.

* Хотя многие трактовки этой темы сосредоточены на узком определении «группы», концепция на самом деле очень гибкая: это просто набор наблюдений, которые имеют общее свойство. Группа может состоять из нескольких наблюдений за одним человеком, или несколькими людьми в школе, или несколькими школами в округе, или несколькими сортами одного вида фруктов, или несколькими видами овощей из одного урожая, или несколькими урожаями. одного и того же вида овощей и т. д. Любая категориальная переменная может использоваться в качестве группирующей переменной.

Павел
источник
19
+6. Я думаю, что в настоящее время это лучший ответ в этой теме, и, надеюсь, со временем он станет самым решительным. Одно из предложений, которое я хотел бы сделать, - это включить некоторые формулы: возможно, в вашем разделе «Пример» вы можете предоставить формулы, определяющие модели с фиксированным и случайным эффектом (и, возможно, также модель «с одним коэффициентом», то есть модель с «полным пулом»). «). Я думаю, что формулы сделают ваш ответ более четким и привлекательным (в настоящее время он выглядит как текстовая стена).
амеба
3
@amoeba спасибо! Вы правы в том, что коэффициент - это неправильное слово, это больше похоже на «модельный термин», чем коэффициент. Формулы помогут прояснить этот и другие вопросы. Я потихоньку подправлял этот ответ, когда пришло время и вдохновение, и буду продолжать это делать до тех пор, пока не доберусь до нужного места! Я, вероятно, уточню формулы для «регрессии против одной категориальной переменной». Полное объединение = групповые коэффициенты идентичны (дельта-предшествующий, нулевая сигма), частичное объединение = они могут немного отличаться (конечная сигма), отсутствие объединения = отсутствие ограничения (бесконечная сигма).
Пол
Спасибо за отличный ответ! Тем не менее, я потерял вас из-за того, что «вы можете уменьшить это, используя оценку усадки (так называемый частичный пул), которая подтолкнет экстремальные значения к среднему доходу по всем почтовым индексам». Что такое частичное объединение? Не могли бы вы привести интуитивный пример? Кроме того, как страница Википедии о случайных эффектах согласуется с тем, что вы сказали? Их пример "случайного эффекта" не учитывает размеры выборки вообще.
AlphaOmega,
2
Поздравляем с передачей 100 голосов за этот ответ :-)
amoeba
1
@Paul Я действительно изо всех сил пытаюсь понять, как объединить этот ответ (например, «Люди ... думают ... фиксированные эффекты должны использоваться, когда что-то« фиксировано », в то время как случайные эффекты должны использоваться, когда что-то« выбирается случайным образом »). ") с тем, что я вижу в том, как стандартные ошибки получаются в смешанных моделях, где SE со случайными эффектами кажутся мне совместимыми только с предположением, что они выбираются случайным образом, а SE с фиксированными эффектами, только если они фиксированы См., Например, здесь . Что я пропускаю? Любые мысли ценятся за пределами слов !!
Justme
47

Я написал об этом в главе книги о смешанных моделях (глава 13 в Fox, Negrete-Yankelevich и Sosa 2014 ); соответствующие страницы (стр. 311-315) доступны в Google Книгах . Я думаю, что вопрос сводится к "каковы определения фиксированных и случайных эффектов?" («смешанная модель» - это просто модель, которая содержит оба). Мое обсуждение говорит немного меньше об их формальном определении (для которого я бы отложил статью Гельмана, связанную с ответом @ JohnSalvatier выше), а также об их практических свойствах и полезности. Вот некоторые выдержки:

Традиционный взгляд на случайные эффекты - это способ сделать правильные статистические тесты, когда некоторые наблюдения коррелируют.

Мы также можем думать о случайных эффектах как о способе объединения информации с разных уровней в группирующей переменной.

Случайные эффекты особенно полезны, когда у нас есть (1) много уровней (например, много видов или блоков), (2) относительно мало данных на каждом уровне (хотя нам нужно несколько выборок с большинства уровней) и (3) неравномерность выборка по уровням (вставка 13.1).

Частые и байесовские исследователи определяют случайные эффекты несколько по-разному, что влияет на то, как они их используют. Частые участники определяют случайные эффекты как категориальные переменные, уровни которых выбираются случайным образом из большей популяциинапример, виды, выбранные случайным образом из списка эндемичных видов. Байесовские функции определяют случайные эффекты как наборы переменных, параметры которых [все] взяты из [того же] распределения. Частотное определение является философски последовательным, и вы встретите исследователей (включая рецензентов и наблюдателей), которые настаивают на этом, но это может быть практически проблематичным. Например, это означает, что вы не можете использовать виды в качестве случайного эффекта, когда вы наблюдали все виды на своем полевом участке, поскольку список видов не является выборкой из более крупной популяции, или использовать год в качестве случайного эффекта, поскольку исследователи редко проводят эксперимент в случайно выбранных годах - они обычно используют либо серию последовательных лет, либо случайный набор лет, когда они могут попасть в поле.

Случайные эффекты также могут быть описаны как предикторные переменные, в которых вы заинтересованы делать выводы о распределении значений (т. Е. О дисперсии значений ответа на разных уровнях), а не тестировать различия значений между конкретными уровнями.

Люди иногда говорят, что случайные эффекты - это «факторы, которые вас не интересуют». Это не всегда так. Хотя это часто имеет место в экологических экспериментах (где различия между участками обычно являются просто неприятностью), иногда это представляет большой интерес, например, в эволюционных исследованиях, где различия между генотипами являются сырьем для естественного отбора, или в демографических исследованиях где колебания между годами снижают долгосрочные темпы роста. В некоторых случаях фиксированные эффекты также используются для контроля неинтересных вариаций, например, использование массы в качестве ковариации для контроля за эффектами размера тела.

Вы также услышите, что «вы ничего не можете сказать о (прогнозируемом) значении условного режима». Это также неверно - вы не можете формально проверить нулевую гипотезу о том, что значение равно нулю или что значения двух разных уровней одинаковы, но все же вполне разумно смотреть на прогнозируемое значение и даже вычислять стандартную ошибку прогнозируемого значения (например, см. столбцы ошибок вокруг условных режимов на рисунке 13.1).

Байесовская структура имеет более простое определение случайных эффектов. При байесовском подходе фиксированный эффект - это тот, где мы оцениваем каждый параметр (например, среднее значение для каждого вида в пределах рода) независимо (с независимо указанными априорами), в то время как для случайного эффекта параметры для каждого уровня моделируются как нарисованные из дистрибутива (обычно нормальный); в стандартной статистической записи: .species_meanN(genus_mean,σspecies2)

Я сказал выше, что случайные эффекты наиболее полезны, когда переменная группировки имеет много измеренных уровней. И наоборот, случайные эффекты обычно неэффективны, когда группирующая переменная имеет слишком мало уровней. Обычно вы не можете использовать случайные эффекты, когда переменная группировки имеет менее пяти уровней, а оценки дисперсии случайных эффектов нестабильны с менее чем восемью уровнями, потому что вы пытаетесь оценить дисперсию из очень маленькой выборки.

Бен Болкер
источник
предварительный просмотр в настоящее время не показывает страниц после 311 и пропускает p 310, что, кажется, было бы очень полезно здесь ...
летает
может это региональный вопрос? спасибо за четкий ответ выше, во всяком случае!
летает
1
У меня также нет доступа к результатам Google Книг. Спасибо за включение текста здесь.
MichaelChirico
Мне очень нравится этот отрывок. Это, пожалуй, самое ясное и наиболее полезное описание того, когда и зачем использовать случайные эффекты, которые я видел. Жаль, что у меня не было этого, когда я преподавал пару лет назад.
Грегор,
39

Фиксированный эффект: что-то, что экспериментатор непосредственно манипулирует и часто повторяется, например, введение лекарства - одна группа получает наркотик, одна группа получает плацебо.

Случайный эффект: Источник случайных отклонений / экспериментальные единицы, например, индивидуумы, взятые (случайным образом) из популяции для клинического испытания. Случайные эффекты оценивают изменчивость

Смешанный эффект: включает оба, фиксированный эффект в этих случаях оценивает коэффициенты уровня популяции, в то время как случайные эффекты могут учитывать индивидуальные различия в ответ на эффект, например, каждый человек получает и наркотик, и плацебо в разных случаях, фиксированный «Эффект» оценивает эффект препарата, термины «случайный эффект» позволяют каждому человеку по-разному реагировать на препарат.

Общие категории смешанных эффектов - повторные измерения, продольные, иерархические, сплит-сюжет.

Мэтт Альбрехт
источник
3
Вы не ошиблись, но ваше определение понятия «фиксированный эффект» - это не то, о чем я думаю, когда кто-то говорит «фиксированный эффект». Вот то, о чем я думаю, когда кто-то говорит «фиксированный эффект» en.wikipedia.org/wiki/Difference_in_differences или этот stata.com/support/faqs/stat/xtreg2.html (в частности, уравнение 3 на странице Stata)
Энди В.
@ AndyW: Правильно ли я понимаю, что ваше понимание того, что такое «фиксированный эффект», соответствует определению №1, приведенному Гельманом и приведенному в (принятом) ответе Джона Сальватье в этой теме?
амеба
1
ai
1
ai
1
@amoeba Я согласен, этот ответ должен быть -1. Он не дает точного общего объяснения и не определяет условия, при которых это конкретное объяснение будет действительным. Так, кто мог бы встретить этот ответ и получить надежные, полезные знания?
Пол
23

Я пришел к этому вопросу отсюда , возможный дубликат.

Уже есть несколько превосходных ответов, но, как указано в принятом ответе, существует много различных (но связанных) применений этого термина, поэтому может быть полезным дать представление о том, как это используется в эконометрике, которая пока не рассматривается здесь полностью. ,

yit=Xitδ+αi+ηit,
αiηit

αi

αiXitCov(αi,Xit)=0

yXyitXit

αiXitiXit=0Xit

δtαiXit

Tm

введите описание изображения здесь

Вот код, который генерирует данные и который дает положительную оценку RE и «правильную», отрицательную оценку FE. (Тем не менее, оценки RE также часто будут отрицательными для других семян, см. Выше.)

library(Jmisc)
library(plm)
library(RColorBrewer)
# FE illustration
set.seed(324)
m = 8
n = 12

step = 5
alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))
beta = -1
y = X = matrix(NA,nrow=m,ncol=n)
for (i in 1:n) {
  X[,i] = runif(m,i,i+1)
  X[,i] = rnorm(m,i)
  y[,i] = alpha[i] + X[,i]*beta + rnorm(m,sd=.75)  
}
stackX = as.vector(X)
stackY = as.vector(y)

darkcols <- brewer.pal(12, "Paired")
plot(stackX,stackY,col=rep(darkcols,each=m),pch=19)

unit = rep(1:n,each=m)
# first two columns are for plm to understand the panel structure
paneldata = data.frame(unit,rep(1:m,n),stackY,stackX) 
fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")

Выход:

> fe

Model Formula: stackY ~ stackX

Coefficients:
 stackX 
-1.0451 


> re

Model Formula: stackY ~ stackX

Coefficients:
(Intercept)      stackX 
   18.34586     0.77031 
Кристоф Ханк
источник
1
δ
1
Кроме того, оказывается, что с этим примером можно работать со смешанными эффектами. Вот документ, который показывает, как: acadecommons.columbia.edu/download/fedora_content/download/…
Пол
1
TN
7
В предшествующем обсуждении было бы более точно заменить «случайные эффекты» на «ограниченную версию случайных эффектов, реализованную в пакете R plm». Существуют и другие модели случайных эффектов, которые прекрасно справляются с коррелированной проблемой предиктор / группа, как в статье, процитированной в моем предыдущем комментарии. Они просто еще не являются частью эконометрических пакетов / литературы. Похоже, что эконометрические определения фиксированных и случайных эффектов очень специфичны для конкретной области и на самом деле не представляют их более фундаментальных общих значений из статистической литературы.
Пол
4
Честно, я немного отредактировал. Но, с другой стороны, это именно то, что делает этот поток таким ценным: разные поля означают разные вещи с более или менее одинаковой терминологией, а различные посты помогают объяснить эти различия.
Кристоф Ханк,
12

Различие имеет смысл только в контексте небайесовской статистики. В байесовской статистике все параметры модели являются «случайными».

Shige
источник
1
Интересно. Но поскольку фиксированное или случайное можно рассматривать как условие данной переменной (данного столбца данных), а не параметра, связанного с этой переменной, ... Ваш ответ полностью применим?
rolando2
1
@ rolando2 В любом случае, это просто ложь. В частности, для байесовских параметров параметры - это то, о чем говорит теория / вероятность. Только один в неопределенности относительно того, что значения они принимают представляется с использованием вероятностных распределений. Следовательно, иногда параметры моделируются как фиксированные и неизвестные («фиксированные»), а иногда как поступающие из распределения («случайные»), хотя последнее устройство часто мотивируется суждением об обменности, а не убеждением о процессе выборки.
сопряженный
Это в отличие от ответа @ben. Я считаю, что ответ неверный.
SmallChess
9

В эконометрике термины обычно применяются в обобщенных линейных моделях, где модель имеет вид

yit=g(xitβ+αi+uit).

αiuit

αi⊥̸uit

В линейных моделях наличие случайного эффекта не приводит к несогласованности оценки OLS. Однако использование оценки случайных эффектов (например, выполнимых обобщенных наименьших квадратов) приведет к более эффективной оценке.

В нелинейных моделях , таких как probit, tobit, ..., наличие случайного эффекта, как правило, приводит к противоречивой оценке. Использование оценщика случайных эффектов восстановит последовательность.

Как для линейных, так и для нелинейных моделей фиксированные эффекты приводят к смещению. Однако в линейных моделях есть преобразования, которые можно использовать (например, первые различия или унижение), где OLS на преобразованных данных приведет к согласованным оценкам. Для нелинейных моделей существует несколько исключений, в которых существуют преобразования, примером которых может служить фиксированный эффект .

Пример: случайный эффект пробит. предполагать

yit=xitβ+αi+uit,αiN(0,σα2),uitN(0,1).

и наблюдаемый результат

yit=1(yit>0).

Оценка максимального правдоподобия в пуле минимизирует выборочное среднее значение

β^=argminβN1i=1Nlogt=1T[G(xitβ)]yit[1G(xitβ)]1yit.

Конечно, здесь лог и произведение упрощаются, но по педагогическим причинам это делает уравнение более сопоставимым с оценщиком случайных эффектов, который имеет вид

β^=argminβN1i=1Nlogt=1T[G(xitβ+σαa)]yit[1G(xitβ+σαa)]1yitϕ(a)da.

Мы можем, например, аппроксимировать интеграл рандомизацией, взяв случайных нормалей и оценив вероятность каждого из них.R

β^=argminβN1i=1NlogR1r=1Rt=1T[G(xitβ+σαar)]yit[1G(xitβ+σαa)]1yit,arN(0,1).

Интуиция следующая: мы не знаем, какой тип, , у каждого наблюдения. Вместо этого мы оцениваем произведение вероятностей с течением времени для последовательности розыгрышей. Наиболее вероятный тип наблюдения у будет иметь наибольшую вероятность во всех периодах и, следовательно, будет доминировать вклад вероятности для этой последовательности наблюдений. i TαiiT

Superpronker
источник
7

Не совсем формальное определение, но мне нравятся следующие слайды: Смешанные модели и почему социолингвисты должны их использовать ( зеркало ), от Даниэля Эзры Джонсона. Краткое резюме 'предлагается на слайде 4. Хотя оно в основном сфокусировано на психолингвистических исследованиях, оно очень полезно в качестве первого шага.

хл
источник
Я думаю, что мне нужно будет увидеть эту презентацию лично, чтобы получить полное влияние.
Энди W
Эти слайды не являются полезными.
летает
7
Хотя эта ссылка может ответить на вопрос, лучше включить сюда основные части ответа и предоставить ссылку для справки. Ответы, содержащие только ссылки, могут стать недействительными, если связанная страница изменится.
Бен Болкер
1
ссылка мертва
baxx
3

Другой очень практичный взгляд на модели случайных и фиксированных эффектов связан с эконометрикой при выполнении линейных регрессий на панельных данных . Если вы оцениваете связь между пояснительной переменной и выходной переменной в наборе данных с несколькими выборками на отдельного человека / группу, вы должны использовать эту структуру.

Хорошим примером панельных данных являются ежегодные измерения от группы лиц:

  • Igenderi (пол го человека)i
  • т яΔweightit (изменение веса в течение года для человека )ti
  • т яexerciseit (среднесуточная упражнение в течение года для человека )ti

Если мы пытаемся понять взаимосвязь между физической нагрузкой и изменением веса, мы настроим следующую регрессию:

е х е р с я ы е я т + β 1 г е н д е р я + α я + ε я тΔweightit=β0exerciseit+β1genderi+αi+ϵit

  • β0 - количество процентов
  • β1 не интересно, мы просто контролируем пол
  • αi - индивидуальный перехват
  • ϵit - это термин ошибки

В такой конфигурации существует риск эндогенности. Это может произойти, когда неизмеренные переменные (такие как семейное положение) связаны как с физической нагрузкой, так и с изменением веса. Как объяснено на стр. 16 в этой лекции в Принстоне , модель случайных эффектов (АКА-смешанные эффекты) более эффективна, чем модель с фиксированными эффектами. Тем не менее, он будет неправильно приписывать некоторое влияние неизмеренной переменной на изменение веса упражнениям, к неверному и, возможно, более высокой статистической значимости, чем допустимо. В этом случае модель случайных эффектов не является последовательной оценкой .β 0β0β0

Модель с фиксированными эффектами (в ее самой основной форме) управляет любыми неизмеряемыми переменными, которые постоянны во времени, но различаются между людьми, явно включая отдельный член перехвата для каждого человека ( ) в уравнении регрессии. В нашем примере, он будет автоматически контролировать смешанные последствия от пола, а также любых неизмеренных факторов (семейное положение, социально-экономический статус, уровень образования и т. Д.). Фактически, пол не может быть включен в регрессию, и не может быть оценен моделью с фиксированными эффектами, так как коллинеарен с .β 1 g e n d e r i α iαiβ1genderiαi

Итак, ключевой вопрос - определить, какая модель подходит. Ответ - тест Хаусмана . Чтобы использовать его, мы проводим регрессию с фиксированными и случайными эффектами, а затем применяем критерий Хаусмана, чтобы увидеть, значительно ли расходятся их оценки коэффициентов. Если они расходятся, эндогенность играет роль, и модель с фиксированными эффектами - лучший выбор. В противном случае мы пойдем со случайными эффектами.

Том В.
источник