В линейной вероятностной модели или регрессии любого рода можно использовать оценку фиксированного эффекта, просто добавив в код STATA i.something. Это «что-то» может быть деревней, округом или страной. При этом посмотрите на вариацию в пределах этой географической единицы, как показано ниже:
$ Y_ {ivt} = B_0 + B_1X_ {it} + B_2X_ {vt} + \ alpha_v + \ epsilon_ {vit} $
Где индексы $ _i $, $ _v $ и $ _t $ представляют соответственно индивидуальные, деревенские и временные измерения. Термин $ a_v $ означает фиксированный эффект деревни, поэтому любая регрессия будет рассматриваться в рамках вариации деревни.
Код STATA (1): рег Y, Var1, Var2, i.village, vce (кластерная деревня)
Здесь я подхожу к сути. В наборе ковариат, который я использую, есть одна категориальная переменная, принимающая несколько разных значений. Эта категориальная переменная может представлять цвета, страховую компанию или этническую принадлежность и т. Д. В STATA я представляю эту переменную как i.categorical. Таким образом, код STATA становится:
Код STATA (2): reg Y Var1 Var2 i.categorical i.village, vce (кластерная деревня)
Мне трудно интерпретировать значение этой регрессии. При проведении такой регрессии, я смотрю на вариации в категориях в деревне? Это смотрит на изменение Y для людей, принадлежащих к той же категории в пределах одной деревни.
Спасибо!
источник
Ответы:
Ваша интерпретация коэффициента на Var1 или Var2 - это влияние, которое переменная оказывает на Y если человек находится в базовой категории , Т.е. если бы все фиктивные переменные-пустышки были 0.
Вы не смотрите на изменения в каждой категории. Вы предполагаете, что два наблюдения в пределах одной категории, но разных деревень являются независимый, в отличие от того, что вы предполагаете для двух наблюдений в пределах одной деревни.
Категорические манекены существуют, чтобы держать их постоянными, когда вы смотрите на другие переменные.
источник