Модели дискретного времени опасности (cloglog) в R

10

survivalПакет вR появляешься , чтобы сосредоточиться на непрерывные моделях выживания времени. Я заинтересован в оценке версии пропорциональной модели риска с дискретным временем, дополнительной модели log-log. У меня довольно простая модель выживания с простой правильной цензурой.

Я знаю, что одним из способов оценки этой модели является создание набора данных, который имеет отдельную строку для каждого наблюдения для каждого периода, в котором он не является «мертвым». Затем glmмодель сcloglog ссылкой.

Этот подход кажется очень неэффективным для памяти; действительно, он, скорее всего, произведет набор данных, который слишком велик для памяти на моей машине.

Второй подход заключается в том, чтобы самому кодировать MLE. Это было бы достаточно просто, но я надеюсь, что есть пакет, в котором есть эта модель выживания. Было бы проще для совместной работы и избежать ошибок кодирования при использовании пакета.

Кто-нибудь знает такой пакет?

Чарли
источник
2
Если это дискретное время, у вас должно быть много связей, верно? У меня сложилось впечатление, что coxph(ties="exact")в стандартном survivalпакете модель делает модель "условной логистической моделью, и она подходит, когда времена представляют собой небольшой набор дискретных значений". Разве это не сработает для вас? Это б / с, это не будет использовать cloglogссылку?
gung - Восстановить Монику
1
@ gung, спасибо за указатель; Я не знал об этой функции. Я предпочел бы использовать cloglogссылку, хотя.
Чарли

Ответы:

8

Наличие нескольких строк для каждого наблюдения может показаться излишним, но, скорее всего, это не так. Если в модели есть какие-то изменяющиеся во времени ковариаты, то каждый месяц наблюдения, безусловно, будет нуждаться в отдельной строке. Одним конкретным примером изменяющейся во времени ковариаты является прошедшее время. Поскольку эта переменная почти наверняка должна быть включена в модель, имеет смысл иметь отдельную строку для каждого периода наблюдения. Таким образом, первый предложенный подход, вероятно, является лучшим.

Обратите внимание, что это отличается от модели рисков с непрерывным пропорциональным временем и распределением Вейбулла. Там модель выживания может быть упрощена до одной строки для каждого наблюдения, если прошедшее время является единственным изменяющимся во времени ковариатом (см. Здесь , например). Аналогичный результат имеет место для модели пропорциональной опасности Кокса.

Чарли
источник