Интерпретация коэффициентов взаимодействия между категориальной и непрерывной переменной

10

У меня вопрос по поводу интерпретации коэффициентов взаимодействия между непрерывной и категориальной переменными. вот моя модель:

model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), 
               data=base_708)

Coefficients:
                         Estimate Std. Error t value Pr(>|t|)    
(Intercept)               21.4836     2.0698  10.380  < 2e-16 ***
lg_hag                     8.5691     3.7688   2.274  0.02334 *  
raceblack                 -8.4715     1.7482  -4.846 1.61e-06 ***
racemexican               -3.0483     1.7073  -1.785  0.07469 .  
racemulti/other           -4.6002     2.3098  -1.992  0.04687 *  
pdg                        2.8038     0.4268   6.570 1.10e-10 ***
sexfemale                  4.5691     1.1203   4.078 5.15e-05 ***
as.factor(educa)2         13.8266     2.6362   5.245 2.17e-07 ***
as.factor(educa)3         21.7913     2.4424   8.922  < 2e-16 ***
as.factor(educa)4         19.0179     2.5219   7.541 1.74e-13 ***
as.factor(educa)5         23.7470     2.7406   8.665  < 2e-16 ***
lg_hag:as.factor(educa)2 -21.2224     6.5904  -3.220  0.00135 ** 
lg_hag:as.factor(educa)3 -19.8083     6.1255  -3.234  0.00129 ** 
lg_hag:as.factor(educa)4  -8.5502     6.6018  -1.295  0.19577    
lg_hag:as.factor(educa)5 -17.2230     6.3711  -2.703  0.00706 ***

допустим, уравнение модели:

E [cog] = a + b1 (lg_hag) + b2 (educa2 * lg_hag) + b3 (educa3 * lg_hag) + b4 (educa4 * lg_hag) + b5 (pdg, по центру) + другие ковары, где

b1 = difference in cog  with higher lg_hag among lowest education (coded as 1)
b1 + b2 = difference in cog with higher lg_hag among middle education (coded as 2)
b1 + b3 = difference in cog with higher lg_hag among high education (coded as 3)
b1 + b3 = difference in cog with higher lg_hag among very high education (coded as 4)
b5 = difference in cog with each unit increase in pdg

Мой вопрос: если моя интерпретация верна, как построить доверительные интервалы для каждой оценки эффекта взаимодействий (например, b1 + b2) из ​​доверительных интервалов b1 и b2.

Вы в безопасности
источник
не очень знакомы с тем, как это сделать в R. предположим, что в sas вы можете получить результат с помощью оператора "эстимейт", обратитесь к support.sas.com/documentation/cdl/en/statug/63033/HTML/default/…
boomean

Ответы:

8

Ваша интерпретация коэффициентов модели не совсем точна. Позвольте мне сначала обобщить условия модели.

racesexeduca

racerace={white,black,mexican,multi/other}

sexsex={male,female}

educaeduca={1,2,3,4,5}

По умолчанию R использует контрасты лечения для категориальных переменных. В этих контрастах первое значение коэффициента используется для контрольного уровня, а остальные значения сравниваются с контрольным уровнем. Максимальное количество контрастов для категориальной переменной равно количеству уровней минус один.

racerace=black vs.race=whiterace=mexican vs.race=whiterace=multi/other vs.race=white

educa1cog13.8266educa=2educa=1as.factor(educa)2

raceeducaraceeducasex

lg_hagpdg

lg_hagpdg1

pdglg_hageducaeduca=1lg_hag

lg_hag×educa

lg_hageducalg_hageducaeduca=1

lg_hag:as.factor(educa)2-21.2224lg_hag21.2224educa=2educa=1

Свен Хоэнштейн
источник
«Эти коэффициенты взаимодействия также справедливы для race=whiteи sex=maleтолько». Ты уверен в этом? Я спрашиваю, потому что ни, raceни sexво взаимодействии с lg_hag×educaтермином ... Я смотрю несколько текстов, я не вижу это явно указано.
Ландрони
2
@landroni Склоны оцениваются для точки, где все остальные предикторы равны 0.
Свен Хоэнштайн
Да, я тоже так понимаю. Все остальные предикторы остаются постоянными, что означает, что факторы зафиксированы на их базовом уровне. Но в этом и заключается моя загадка: я просмотрел несколько книг, которые в основном затуманивают этот тонкий, но далеко идущий нюанс. Более того, в документах часто «контролируется по отраслям», но при этом делаются выводы, как будто коэффициенты были безусловными по всей выборке, вместо того, чтобы указывать
Ландрони
1
«Если в модели присутствуют контрасты лечения для категориальной переменной, оценка дополнительных эффектов основана на контрольном уровне категориальной переменной». После дальнейшего рассмотрения я не уверен (или не полностью следую вашему аргументу). Похоже, вы подразумеваете, что оценка бета для, например, pdgзависит от контрольного уровня, что явно не так. Если я изменю контрольный уровень какого-либо из факторов (например sex), оценка pdgНЕ изменится ...
landroni
1
@landroni Спасибо за указание. Вы правы, это утверждение вводит в заблуждение. На самом деле, это верно только для предикторов, которые также являются частью терминов взаимодействия с категориальными переменными. Следовательно, оценка pdgдействительно не зависит от спецификации контрастов. Я изменю ответ соответственно.
Свен Хоэнштейн