Как мне интерпретировать кривую выживания модели риска Кокса?

9

Как вы интерпретируете кривую выживания из модели пропорционального риска Кокса?

В этом игрушечном примере предположим, что у нас есть модель пропорционального риска Кокса для ageпеременной в kidneyданных, и сгенерируем кривую выживания.

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

введите описание изображения здесь

Например, в момент , какое утверждение верно? или оба не правы?200

  • Утверждение 1: у нас будет 20% оставленных предметов (например, если у нас человек, к дню у нас должно остаться приблизительно ), 200 2001000200200

  • Утверждение 2: Для одного данного человека он / она имеет шанс выжить в день .20020%200


Моя попытка: я не думаю, что эти два утверждения совпадают (поправьте меня, если я ошибаюсь), поскольку у нас нет предположения iid (время выживания для всех людей НЕ зависит от одного распределения независимо). Это похоже на логистическую регрессию в моем вопросе здесь , уровень опасности каждого человека зависит от для этого человека.βTx

Хайтау Ду
источник
Обратите внимание, что ваша модель предполагает независимость от времени события.
ocram
анализ выживания может иметь предположения о независимости
Аксакал
так что, похоже, вопрос действительно в R-кодировании, а не в чистой статистике. необходимо знать синтаксис и особенности конкретных функций, используемых в примере. если это так, разве это не в какой-то степени не так? в противном случае вам нужно объяснить, что происходит тем, кто не использует R
Аксакал,

Ответы:

5

Поскольку опасность зависит от ковариат, также зависит и функция выживания. Модель предполагает, что функция опасности человека с ковариантным вектором равна Следовательно, кумулятивная опасность этого человека где мы можем определить как базовую совокупную опасность. Функция выживания для индивида с ковариатическим вектором , в свою очередь, где мы определяем в качестве базовой функции выживания. x

h(t;x)=h0(t)eβx.
H(t;x)=0th(u;x)du=0th0(u)eβxdu=H0(t)eβx,
H0(t)=0th0(u)dux
S(t;x)=eH(t;x)=eH0eβx=S0(t)eβx
S0(t)=eH0(t)

Учитывая оценки и коэффициентов регрессии и базовой функции выживания, оценка функции выживания для индивидуума с ковариатным вектором дается как . S 0(т)х S (т;х)= S 0(т)е β ' хβ^S^0(t)xS^(t;x)=S^0(t)eβ^x

Вычислив это в R вы указываете значение ваших ковариат в newdataаргументе. Например, если вы хотите, чтобы функция выживания для людей в возрасте = 70, в R, сделайте

plot(survfit(fit, newdata=data.frame(age=70)))

Если вы, как и вы, опускаете newdataаргумент, его значение по умолчанию равно средним значениям ковариат в образце (см. ?survfit.coxph). Итак, на вашем графике показана оценка . S0(t)eβx¯

Ярле Туфто
источник
Я с тобой согласен. Это хорошо написанный ответ. Я извиняюсь перед ОП за свою ошибку и ценю то, как ОП исправил ее.
Майкл Р. Черник
@ hxd1101 После survfit.coxphболее внимательного прочтения страницы справки я исправил ошибку в своем ответе, см. обновление.
Ярле Туфто
2

У нас останется 20% предметов (например, если у нас 1000 человек, к 200 дню у нас должно быть 200 человек)? или для данного человека он имеет 20% шансов выжить в день 200?

В своем наиболее чистом виде кривая Каплана-Мейера в вашем примере не дает ни одного из приведенных выше утверждений.

Первое утверждение делает прогнозная проекция будет . Базовая кривая выживания описывает только ваше прошлое. Да, 20% вашего образца выжили к 200 дню. 20% выживут в следующие 200 дней? Не обязательно.

Чтобы сделать это утверждение, вы должны добавить больше предположений, построить модель и т. Д. Модель даже не должна быть статистической в ​​некотором смысле, как логистическая регрессия. Например, это может быть PDE в эпидемиологии и т. Д.

Ваше второе утверждение, вероятно, основано на некотором предположении об однородности: все люди одинаковы.

Аксакал
источник
Я не думаю, что утверждение 2 является правильным, так как у каждого человека разные и вносит свой вклад в опасность. как мы можем предположить, что все люди одинаковы? β T xxβTx
Haitao Du
@ hxd1011, это зависит от вашей модели. Если бы вы моделировали детали автомобилей, то вполне могли бы предположить, что они одинаковые. с другой стороны, их неудачи могут быть соотнесены с номером партии, тогда они не совпадают и т. д.
Аксакал,
Я отредактировал свой вопрос, чтобы он был более конкретным по модели Кокса. Ваш ответ по кривой Kaplan_Meier все еще применим?
Haitao Du
2

Спасибо за ответ Ярле Туфто. Я думаю, что я должен быть в состоянии ответить на него сам: оба утверждения являются ложными . Сгенерированная кривая но не .S ( т )S0(t)S(t)

Функция выживания базовой линии будет равна только тогда, когда . Следовательно, кривая НЕ описывает все население или отдельного человека.S ( t ) x = 0S0(t)S(t)x=0

Хайтау Ду
источник
0

Ваш первый вариант правильный. В общем случае , указывает на то, что 20% первоначальных пациентов сохранились до дня , без учета цензурирования . По данным, подвергнутым цензуре, неверно утверждать, что 20% были еще живы в тот день , поскольку некоторые из них были потеряны для последующего наблюдения, а их статус неизвестен. Лучший способ выразить это - оценить, что доля пациентов, которые еще живы в тот день, составляет 20% . тS(t)=0.2t

Второй вариант (шанс выжить еще один день при условии выживания до ) - , где обозначает функцию опасности.1 - h ( t ) h ( t )t1h(t)h(t)

Что касается предположений: я думал, что обычные тесты коэффициентов в регрессии Кокса предполагают независимость, при условии, что наблюдаемые ковариаты? Кажется, что даже оценка Каплана-Мейера требует независимости между временем выживания и цензурой ( ссылка ). Но я могу ошибаться, поэтому исправления приветствуются.

juod
источник