В анализе выживаемости, почему мы используем полупараметрические модели (пропорциональные риски Кокса) вместо полностью параметрических моделей?

24

Я изучал модель пропорциональных рисков Кокса, и этот вопрос скрыт в большинстве текстов.

Кокс предложил подгонку коэффициентов функции Хазарда с использованием метода частичного правдоподобия, но почему бы просто не подогнать коэффициенты параметрической функции выживания с использованием метода максимального правдоподобия и линейной модели?

В любых случаях, когда вы подвергали цензуре данные, вы можете просто найти область под кривой. Например, если ваша оценка составляет 380 со стандартным отклонением 80, а выборка подвергается цензуре> 300, то для этой выборки существует вероятность 84% в расчете вероятности, предполагающем нормальную ошибку.

user1956609
источник
Как бы мне ни хотелось задавать вопросы актуарной науки здесь, я должен сказать, что этот вопрос, вероятно, получит лучший ответ на сайте статистики, Cross Validated. Вы можете попросить модератора перенести его.
График
Хорошо, не понял, что существовало. Не уверен, как запросить миграцию. Пожалуйста, мигрируйте?
@ Граф, я также не осознавал, что был один ... Я не нашел его в списке "всех сайтов", не могли бы вы дать ссылку здесь? Спасибо

Ответы:

27

Если вы знаете параметрическое распределение, которому следуют ваши данные, используйте подход максимального правдоподобия, и распределение имеет смысл. Реальное преимущество регрессии Пропорциональных рисков Кокса состоит в том, что вы все еще можете соответствовать моделям выживания, не зная (или не предполагая) распределение. Вы привели пример с использованием нормального распределения, но большинство времен выживания (и других типов данных, для которых используется регрессия Кокса PH) не приближаются к нормальному распределению. Некоторые могут следовать логарифмически нормальному, или вейбулловскому, или другому параметрическому распределению, и если вы готовы сделать такое предположение, тогда параметрический подход с максимальной вероятностью велик. Но во многих случаях реального мира мы не знаем, каково соответствующее распределение (или даже достаточно близкое приближение). С цензурой и ковариатами мы не можем сделать простую гистограмму и сказать «это похоже на… распределение для меня». Поэтому очень полезно иметь технику, которая работает хорошо, без необходимости конкретного распределения.

Зачем использовать опасность вместо функции распределения? Рассмотрим следующее утверждение: «Люди в группе A в два раза чаще умирают в возрасте 80 лет, чем люди в группе B». Теперь это может быть правдой, потому что люди в группе B, как правило, живут дольше, чем люди в группе A, или это может быть потому, что люди в группе B, как правило, живут более короткой жизнью, и большинство из них мертвы задолго до 80 лет, что дает очень небольшую вероятность из них умирают в возрасте 80 лет, в то время как достаточное количество людей в группе А доживает до 80 лет, и значительное число из них умрет в этом возрасте, что приведет к гораздо большей вероятности смерти в этом возрасте. Таким образом, одно и то же утверждение может означать, что пребывание в группе А лучше или хуже, чем в группе В. Что имеет больше смысла, так это сказать, что те люди (в каждой группе), которые жили до 80 лет, в какой пропорции умрут до того, как им исполнится 81 год. Это и есть опасность (а опасность является функцией функции распределения / функции выживания / и т. Д.). С этой опасностью проще работать в полупараметрической модели, которая затем может дать вам информацию о распределении.

Грег Сноу
источник
7
Хороший ответ. Что уникально во времени, так это то, что оно движется в одном направлении, и как только мы выдержали период высокого риска, мы в основном заинтересованы в действующем риске. Вот что говорит нам функция опасности.
Фрэнк Харрелл
2
Еще один момент, который стоит добавить, заключается в том, что при цензуре данных проверка предположений о распределении может быть очень сложной. Например, предположим, что только 20% ваших субъектов наблюдают событие. Попытка определить, следуют ли хвосты распределения за распределением Вейбулла, явно невозможна! Модель Cox-PH несколько обходит проблему (но вы должны очень осторожно относиться к предположению о пропорциональных опасностях, если вы хотите экстраполировать на области, которые были подвергнуты сильной цензуре)
Cliff AB
16

«Мы» не обязательно. Диапазон инструментов анализа выживания варьируется от полностью непараметрического, такого как метод Каплана-Мейера, до полностью параметрических моделей, где вы указываете распределение основной опасности. У каждого есть свои преимущества и недостатки.

Полупараметрические методы, такие как модель пропорциональных рисков Кокса, позволяют вам не указывать основную функцию риска. Это может быть полезно, так как мы не всегда знаем основную функцию опасности и во многих случаях также не заботимся . Например, многие эпидемиологические исследования хотят знать, «Уменьшает ли воздействие X время до события Y»? То, что их волнует, - это разница у пациентов, у которых есть X, и у которых нет X. В этом случае основная опасность на самом деле не имеет значения, и риск ее неправильного определения хуже, чем последствия ее незнания.

Однако бывают случаи, когда это также не соответствует действительности. Я выполнил работу с полностью параметрическими моделями, потому что основная опасность представляла интерес.

фомиты
источник
1
«... и риск неверного определения этого хуже, чем последствия незнания». Это было очень полезно, спасибо.
Не могли бы вы привести пример, когда основной интерес будет представлять интерес?
Дан Чалтиэль
1
@DanChaltiel Любая оценка, которая предназначена для включения в математическую модель или тому подобное, может служить примером - основная функция риска там представляет особый интерес.
Fomite