Как вы интерпретируете кривую выживания из модели пропорционального риска Кокса?
В этом игрушечном примере предположим, что у нас есть модель пропорционального риска Кокса для age
переменной в kidney
данных, и сгенерируем кривую выживания.
library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()
Например, в момент , какое утверждение верно? или оба не правы?
Утверждение 1: у нас будет 20% оставленных предметов (например, если у нас человек, к дню у нас должно остаться приблизительно ), 200 200
Утверждение 2: Для одного данного человека он / она имеет шанс выжить в день .200
Моя попытка: я не думаю, что эти два утверждения совпадают (поправьте меня, если я ошибаюсь), поскольку у нас нет предположения iid (время выживания для всех людей НЕ зависит от одного распределения независимо). Это похоже на логистическую регрессию в моем вопросе здесь , уровень опасности каждого человека зависит от для этого человека.
источник
Ответы:
Поскольку опасность зависит от ковариат, также зависит и функция выживания. Модель предполагает, что функция опасности человека с ковариантным вектором равна Следовательно, кумулятивная опасность этого человека где мы можем определить как базовую совокупную опасность. Функция выживания для индивида с ковариатическим вектором , в свою очередь, где мы определяем в качестве базовой функции выживания.x
Учитывая оценки и коэффициентов регрессии и базовой функции выживания, оценка функции выживания для индивидуума с ковариатным вектором дается как . S 0(т)х S (т;х)= S 0(т)е β ' хβ^ S^0(t) x S^(t;x)=S^0(t)eβ^′x
Вычислив это в R вы указываете значение ваших ковариат в
newdata
аргументе. Например, если вы хотите, чтобы функция выживания для людей в возрасте = 70, в R, сделайтеЕсли вы, как и вы, опускаетеS0(t)eβ′x¯
newdata
аргумент, его значение по умолчанию равно средним значениям ковариат в образце (см.?survfit.coxph
). Итак, на вашем графике показана оценка .источник
survfit.coxph
более внимательного прочтения страницы справки я исправил ошибку в своем ответе, см. обновление.В своем наиболее чистом виде кривая Каплана-Мейера в вашем примере не дает ни одного из приведенных выше утверждений.
Первое утверждение делает прогнозная проекция будет . Базовая кривая выживания описывает только ваше прошлое. Да, 20% вашего образца выжили к 200 дню. 20% выживут в следующие 200 дней? Не обязательно.
Чтобы сделать это утверждение, вы должны добавить больше предположений, построить модель и т. Д. Модель даже не должна быть статистической в некотором смысле, как логистическая регрессия. Например, это может быть PDE в эпидемиологии и т. Д.
Ваше второе утверждение, вероятно, основано на некотором предположении об однородности: все люди одинаковы.
источник
Спасибо за ответ Ярле Туфто. Я думаю, что я должен быть в состоянии ответить на него сам: оба утверждения являются ложными . Сгенерированная кривая но не .S ( т )S0(t) S(t)
Функция выживания базовой линии будет равна только тогда, когда . Следовательно, кривая НЕ описывает все население или отдельного человека.S ( t ) x = 0S0(t) S(t) x=0
источник
Ваш первый вариант правильный. В общем случае , указывает на то, что 20% первоначальных пациентов сохранились до дня , без учета цензурирования . По данным, подвергнутым цензуре, неверно утверждать, что 20% были еще живы в тот день , поскольку некоторые из них были потеряны для последующего наблюдения, а их статус неизвестен. Лучший способ выразить это - оценить, что доля пациентов, которые еще живы в тот день, составляет 20% . тS(t)=0.2 t
Второй вариант (шанс выжить еще один день при условии выживания до ) - , где обозначает функцию опасности.1 - h ( t ) h ( t )t 1−h(t) h(t)
Что касается предположений: я думал, что обычные тесты коэффициентов в регрессии Кокса предполагают независимость, при условии, что наблюдаемые ковариаты? Кажется, что даже оценка Каплана-Мейера требует независимости между временем выживания и цензурой ( ссылка ). Но я могу ошибаться, поэтому исправления приветствуются.
источник