Отличается ли подгонка модели Кокса со стратами и стратово-ковариатным взаимодействием от подгонки двух моделей Кокса?

13

В « Стратегиях регрессионного моделирования » Харрелла (второе издание) есть раздел (S. 20.1.7), в котором обсуждаются модели Кокса, включая взаимодействие между ковариатой, основное влияние которой на выживаемость мы также хотим оценить (возраст в примере ниже) и ковариация, основной эффект которой мы не хотим оценивать (пол в примере ниже).

Конкретно: предположим, что в популяции (неизвестная, истинная) опасность h(t) следует модели

h(t)={hf(t)exp(β1age),for female patienshm(t)exp((β1+β2)age),for male patiens
гдеhf ,hm неизвестны, правда, не следует оценивать базовые функции риска иβ1 ,β2 неизвестны, истинные параметры должны быть оценены по данным.

(Этот пример взят почти буквально из книги.)

Теперь Харрелл отмечает, что вышеуказанная ситуация может быть переписана как стратифицированная модель Кокса модели 1 :

h(t)=hgender(t)exp(β1age+β2X)
где «член взаимодействия»X равен нулю для женщин и возрасту для мужчин. Это удобно, потому что это означает, что мы можем использовать стандартную технику для оценкиβ1 иβ2 .

Теперь по вопросу. Предположим, что два исследователя A и B получают одну и ту же выборку пациентов из группы населения, описанной выше. Исследователь А подходит модель 1, получение оценок р 1 , β 2 для истинных параметров р 1 , β 2β^1β^2β1,β2 вместе с доверительными интервалами.

Исследователь B использует более наивный подход к подгонке двух обычных (то есть неучтенных) моделей Кокса: модель 2a:

h(t)=hf(t)exp(γ1age)
только для пациентов женского пола в выборке и модель 2b:
h(t)=hm(t)exp(γ2age)
только для пациентов мужского пола в выборке. Таким образом получая оценки γ1^ , γ2^истинных параметров β1,β1+β2 соответственно вместе с доверительными интервалами.

Вопрос:

  • Являются ли эти оценки обязательно совпадают (в том смысле , что β 1 = γ 1 , р 2 = γ 2 - γ 1β^1=γ^1β^2=γ^2γ^1 )? (Напомним, что оба исследователя смотрят на одни и те же данные.)
  • Являются ли доверительные интервалы обязательно одинаковыми?
  • β2=0h(t)=hgender(t)exp(β1age)
Винсент
источник

Ответы:

4

В моделях, в которых должен оцениваться каждый параметр (например, обычные наименьшие квадраты), можно создать ситуацию, когда две отдельные модели имеют одинаковые оценки одной и члена взаимодействия. Например, мы могли бы иметь:YMзнак равноαM+βM*aграмме, YFзнак равноαF+βF*aграмме в сумме: Yзнак равноλ+λF*F+γ*aграмме+γF*F*aграмме, чтобы вы могли непосредственно оценить разницу по полу как в точке пересечения, так и на склоне. По факту:αM=λ,βM=γ,αFαM=λF,βFβM=γF. In that case, I agree with you that the unique model would allow to have an immediate idea on the gender difference (given by the interaction parameters, λF, since the slope difference has a clearer interpretation, and your question refers to that). However, with the Cox model things are different. First of all, if we don't include gender in the regression there may be a reason, i.e. that it doesn not fulfill the proportional hazard assumption. Also, if we build a unique model with gender as an interaction term, we are assuming a common baseline hazard function (unless I misunderstood the meaning of hgender(t)), while the two-separate-models approach allow for two separate baseline hazard functions, thus different models are implied.

See, for example, the Chapter "Survival Analysis" from Kleinbaum and Klein, 2012, Part of the series Statistics for Biology and Health.

Federico Tedeschi
источник