Я пытаюсь получить интуицию для каждой из основных функций в актуарной науке (специально для модели пропорциональных рисков Кокса). Вот что у меня так далеко:
- : начиная с момента начала, распределение вероятностей, когда вы умрете.
- : только совокупное распределение. В момент времени , какой процент населения погибнет?
- : . В момент времени , какой процент населения будет жив?
- : функция опасности. В данный момент времени людей, которые еще живы, это можно использовать для оценки того, сколько людей умрет в следующем интервале времени или, если интервал-> 0, «мгновенная» вероятность смерти.
- : накопленная опасность. Без понятия.
Какова идея объединения значений опасности, особенно когда они непрерывны? Если мы используем дискретный пример с показателями смертности в течение четырех сезонов, а функция опасности выглядит следующим образом:
- Начиная с весны все живы и 20% умрут
- Теперь летом из оставшихся 50% умрут
- Теперь осенью из оставшихся 75% умрут
- Финальный сезон - зима. Из оставшихся 100% умрут
Тогда совокупная опасность составляет 20%, 70%, 145%, 245% Что это значит, и почему это полезно?
Ответы:
Комбинирование пропорций, умирающих, как и вы, не дает вам кумулятивной опасности. Степень опасности в непрерывном времени - это условная вероятность того, что в течение очень короткого интервала произойдет событие:
Кумулятивная опасность - это интеграция (мгновенной) степени опасности по возрастам / времени. Это как суммируя вероятности, но так как очень мало, эти вероятности, также небольшое количество (например , скорость опасности смерти может быть около 0.004 в возрасте около 30 лет ). Степень опасности зависит от того, не произошло ли событие до t , поэтому для населения оно может составлять более 1.Δt t
Вы можете посмотреть таблицу человеческой смертности, хотя это и есть формулировка с дискретным временем, и попытаться накопить .mx
Если вы используете R, вот небольшой пример аппроксимации этих функций по количеству смертей в каждом возрасте 1 год:
Надеюсь это поможет.
источник
В книге Марио Клевеса «Введение в анализ выживания с использованием Stata» (2-е издание) есть хорошая глава на эту тему.
Вы можете найти главу о книгах Google , стр. 13-15. Но я бы посоветовал прочитать всю главу 2.
Вот краткая форма:
источник
Я бы рискнул предположить, что он заслуживает внимания из-за его использования на диагностических участках:
источник
Перефразируя то, что говорит @Scortchi, я бы подчеркнул, что функция кумулятивной опасности не имеет хорошей интерпретации, и поэтому я бы не стал использовать ее как способ интерпретации результатов; Сообщение нестатистического исследователя о том, что кумулятивные опасности различны, скорее всего, приведет к ответу "мм-хм", и тогда они никогда больше не будут спрашивать о предмете, и не очень хорошо.
Тем не менее, функция совокупной опасности оказывается очень полезной математически, например, общий способ связать функцию опасности и функцию выживания. Поэтому важно знать, что такое накопленная опасность и как ее можно использовать в различных статистических методах. Но в целом, я не думаю, что особенно полезно думать о реальных данных с точки зрения совокупной опасности.
источник