Я изучал модель пропорциональных рисков Кокса, и этот вопрос скрыт в большинстве текстов.
Кокс предложил подгонку коэффициентов функции Хазарда с использованием метода частичного правдоподобия, но почему бы просто не подогнать коэффициенты параметрической функции выживания с использованием метода максимального правдоподобия и линейной модели?
В любых случаях, когда вы подвергали цензуре данные, вы можете просто найти область под кривой. Например, если ваша оценка составляет 380 со стандартным отклонением 80, а выборка подвергается цензуре> 300, то для этой выборки существует вероятность 84% в расчете вероятности, предполагающем нормальную ошибку.
Ответы:
Если вы знаете параметрическое распределение, которому следуют ваши данные, используйте подход максимального правдоподобия, и распределение имеет смысл. Реальное преимущество регрессии Пропорциональных рисков Кокса состоит в том, что вы все еще можете соответствовать моделям выживания, не зная (или не предполагая) распределение. Вы привели пример с использованием нормального распределения, но большинство времен выживания (и других типов данных, для которых используется регрессия Кокса PH) не приближаются к нормальному распределению. Некоторые могут следовать логарифмически нормальному, или вейбулловскому, или другому параметрическому распределению, и если вы готовы сделать такое предположение, тогда параметрический подход с максимальной вероятностью велик. Но во многих случаях реального мира мы не знаем, каково соответствующее распределение (или даже достаточно близкое приближение). С цензурой и ковариатами мы не можем сделать простую гистограмму и сказать «это похоже на… распределение для меня». Поэтому очень полезно иметь технику, которая работает хорошо, без необходимости конкретного распределения.
Зачем использовать опасность вместо функции распределения? Рассмотрим следующее утверждение: «Люди в группе A в два раза чаще умирают в возрасте 80 лет, чем люди в группе B». Теперь это может быть правдой, потому что люди в группе B, как правило, живут дольше, чем люди в группе A, или это может быть потому, что люди в группе B, как правило, живут более короткой жизнью, и большинство из них мертвы задолго до 80 лет, что дает очень небольшую вероятность из них умирают в возрасте 80 лет, в то время как достаточное количество людей в группе А доживает до 80 лет, и значительное число из них умрет в этом возрасте, что приведет к гораздо большей вероятности смерти в этом возрасте. Таким образом, одно и то же утверждение может означать, что пребывание в группе А лучше или хуже, чем в группе В. Что имеет больше смысла, так это сказать, что те люди (в каждой группе), которые жили до 80 лет, в какой пропорции умрут до того, как им исполнится 81 год. Это и есть опасность (а опасность является функцией функции распределения / функции выживания / и т. Д.). С этой опасностью проще работать в полупараметрической модели, которая затем может дать вам информацию о распределении.
источник
«Мы» не обязательно. Диапазон инструментов анализа выживания варьируется от полностью непараметрического, такого как метод Каплана-Мейера, до полностью параметрических моделей, где вы указываете распределение основной опасности. У каждого есть свои преимущества и недостатки.
Полупараметрические методы, такие как модель пропорциональных рисков Кокса, позволяют вам не указывать основную функцию риска. Это может быть полезно, так как мы не всегда знаем основную функцию опасности и во многих случаях также не заботимся . Например, многие эпидемиологические исследования хотят знать, «Уменьшает ли воздействие X время до события Y»? То, что их волнует, - это разница у пациентов, у которых есть X, и у которых нет X. В этом случае основная опасность на самом деле не имеет значения, и риск ее неправильного определения хуже, чем последствия ее незнания.
Однако бывают случаи, когда это также не соответствует действительности. Я выполнил работу с полностью параметрическими моделями, потому что основная опасность представляла интерес.
источник