Каковы плюсы и минусы использования логранка и метода Мантеля-Хензеля для вычисления коэффициента опасности в анализе выживания?

17

Одним из способов суммировать сравнение двух кривых выживаемости является вычисление коэффициента опасности (ЧСС). Есть (как минимум) два метода для вычисления этого значения.

  • Метод Логранка. Как часть вычислений Каплана-Мейера, вычислите число наблюдаемых событий (обычно смертей) в каждой группе ( Оa и ) и количество ожидаемых событий, предполагая нулевую гипотезу об отсутствии различий в выживаемости ( и ). Тогда отношение рисков: ОбЕaЕб
    ЧАСрзнак равно(Оa/Еa)(Об/Еб)
  • Метод Мантеля-Хензеля. Сначала вычислим V, который является суммой гипергеометрических дисперсий в каждой временной точке. Затем вычислите отношение рисков следующим образом: Я получил оба эти уравнения из главы 3 из Machin, Cheung and Parmar, Survival Analysis . В этой книге говорится, что оба метода обычно дают очень похожие методы, и это действительно так, как в примере с книгой.
    ЧАСрзнак равноехр((Оa-Еa)В)

Кто-то прислал мне пример, где два метода отличаются в три раза. В этом конкретном примере очевидно, что оценка логранка является разумной, а оценка Мантеля-Хензеля далека. У меня вопрос: есть ли у кого-нибудь общие советы, когда лучше выбрать логранк-оценку коэффициента опасности и когда лучше выбрать оценку Мантеля-Хензеля? Это связано с размером выборки? Количество связей? Соотношение размеров выборки?

Харви Мотульский
источник
Как эти оценки соотносятся с оценкой Кокса? Это должно быть золотым стандартом для оценки HR.
Анико
Модель Кокса включает в себя ковариаты. Методы Каплана-Мейера, Нельсона-Аалена, Мантеля-Хензеля моделируют опасность как функцию только возраста.
Шаббычеф
@shabbychef: с Коксом PH используйте один двоичный ковариат, то есть код 0/1 для групп сравнения / сравнения, затем exp (бета) = HR.
АРС
Лог-ранг является более мощным тестом, чем РН Кокса, когда выполнено предположение о пропорциональной опасности. Таким образом, при использовании единственной двухуровневой ковариаты предпочтение отдается лог-рангу или критерию Мантеля-Хензеля.
Thylacoleo
см. ниже ответ ...
Thylacoleo

Ответы:

11

Думаю, я разобрался с ответом (на свой вопрос). Если предположение о пропорциональных опасностях верно, оба метода дают одинаковые оценки степени опасности. Я думаю, что расхождение, которое я обнаружил в одном конкретном примере, связано с тем, что это предположение сомнительно.

Если предположение о пропорциональных опасностях верно, то график зависимости log (время) от log (-log (St)) (где St - пропорциональное выживание в момент времени t) должен показывать две параллельные линии. Ниже приведен график, созданный из набора данных проблемы. Кажется, далеко от линейного. Если предположение о пропорциональных опасностях недопустимо, то концепция отношения рисков не имеет смысла, и поэтому не имеет значения, какой метод используется для расчета отношения рисков.

альтернативный текст

Интересно, можно ли использовать несоответствие между оценками логранка и Мантеля-Хензеля для соотношения рисков в качестве метода проверки предположения о пропорциональных опасностях?

Харви Мотульский
источник
7

Если я не ошибаюсь, оценщик лог-ранга, на который вы ссылаетесь, также известен как оценщик Пайка. Я полагаю, что это обычно рекомендуется для ЧСС <3, потому что он демонстрирует меньший уклон в этом диапазоне. Следующая статья может представлять интерес (обратите внимание, что в документе она называется O / E):

[...] Метод O / E является предвзятым, но в пределах диапазона значений отношения уровней риска, представляющих интерес в клинических испытаниях, он более эффективен с точки зрения среднеквадратичной ошибки, чем CML или Mantel-Haenszel. метод для всех, кроме самых крупных испытаний. Метод Мантеля-Хензеля является минимально смещенным, дает ответы, очень близкие к тем, которые получены с использованием CML, и может использоваться для получения удовлетворительных приблизительных доверительных интервалов.

АРС
источник
Кратко рассмотрев эту статью, я не уверен, что оценки, которые они рассматривают, такие же, как в уравнениях спрашивающего. Я согласен с комментариями по этому вопросу - возможно, в 1981 году приблизительные методы были полезны, но в наши дни нет очевидных причин не использовать регрессию Кокса.
OneStop
@onestop: хм, подумайте об определении O / E == LR с журналом, забытым выше? Я согласен с тем, что вы говорите о Cox PH - это не тот вопрос, на который я пытался ответить, но ваш совет лучше в более широком контексте.
АРС
Бернштейн и др. и др. показать некоторые причины (маленькие n, связи), которые приводят к тому, что два метода являются неточными или разными. Но все расхождения, которые они показали, небольшие. Так что я не думаю, что что-то в этой статье объясняет трёхкратное несоответствие, которое я видел, что вызвало этот вопрос. Смотрите ниже ответ, который я придумал.
Харви Мотульский
7

На самом деле существует еще несколько методов, и выбор часто зависит от того, заинтересованы ли вы в поиске ранних различий, более поздних различий или - что касается теста логарифмического ранга и теста Мантеля-Хензеля - дают одинаковый вес всем временным точкам.

К вопросу под рукой. Лог-ранговый тест на самом деле является формой теста Мантеля-Хензеля, применяемого к данным о выживаемости. Тест Мантеля-Хензеля обычно используется для проверки независимости в многослойных таблицах непредвиденных обстоятельств.

Если мы попытаемся применить MH-тест к данным о выживании, мы можем начать с предположения, что события в каждый момент отказа являются независимыми. Затем мы расслаиваемся по времени отказа. Мы используем методы MH для того, чтобы сделать каждое время неудачи стратами. Не удивительно, что они часто дают один и тот же результат.

Исключение возникает, когда одновременно происходит более одного события - несколько смертей в один и тот же момент времени. Я не могу вспомнить, чем отличается лечение. Я думаю, что лог-ранговый тест усредняется по возможным порядкам связанных периодов отказов.

Таким образом, логарифмический тест является тестом МЗ для данных о выживании и может иметь дело со связями. Я никогда не использовал тест МЗ для данных о выживании.

Thylacoleo
источник
3

Я думал, что наткнулся на веб-сайт и ссылку, которая имеет дело именно с этим вопросом:

http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Начните с "Два сравниваемых метода".

Сайт ссылается на статью Берштейна по ссылке (выше):

http://www.jstor.org/stable/2530564?seq=1

Сайт хорошо обобщает результаты Berstein et al, поэтому я процитирую это:

Эти два обычно дают идентичные (или почти идентичные) результаты. Но результаты могут отличаться, когда несколько субъектов умирают одновременно или когда коэффициент опасности далек от 1,0.

Бернсетин и его коллеги проанализировали смоделированные данные обоими методами (1). Во всех их моделях предположение о пропорциональных опасностях было верным. Два метода дали очень похожие значения. Метод logrank (который они называют методом O / E) сообщает о значениях, которые ближе к 1,0, чем истинное соотношение рисков, особенно когда коэффициент опасности большой или размер выборки большой.

Когда есть связи, оба метода менее точны. Методы logrank имеют тенденцию сообщать коэффициенты опасности, которые даже ближе к 1,0 (поэтому сообщаемый коэффициент опасности слишком мал, когда коэффициент опасности больше 1,0, и слишком велик, когда коэффициент опасности меньше 1,0). Метод Мантеля-Хензеля, напротив, сообщает о коэффициентах опасности, которые находятся дальше 1,0 (поэтому сообщаемый коэффициент опасности слишком велик, когда коэффициент опасности больше 1,0, и слишком мал, когда коэффициент опасности меньше 1,0).

Они не тестировали два метода с данными, смоделированными там, где предположение о пропорциональных опасностях неверно. Я видел один набор данных, где две оценки ЧСС были очень разными (в три раза), и предположение о пропорциональной опасности было сомнительным для этих данных. Похоже, что метод Мантеля-Хензеля придает больший вес различиям в поздние моменты времени, в то время как метод логранков дает одинаковый вес везде (но я не изучал это подробно). Если вы видите очень разные значения ЧСС с помощью двух методов, подумайте о том, является ли разумным допущение пропорциональных рисков. Если это предположение не является разумным, то, конечно, вся концепция единого отношения опасности, описывающего всю кривую, не имеет смысла

Сайт также ссылается на набор данных, в котором «две оценки HR были очень разными (в три раза)», и предполагает, что предположение PH является ключевым фактором.

Тогда я подумал: «Кто является автором сайта?» После небольшого поиска я обнаружил, что это был Харви Мотульский. Итак, Харви, мне удалось отослать вас к вам, чтобы ответить на ваш собственный вопрос. Вы стали авторитетом!

Является ли «проблемный набор данных» общедоступным набором данных?

Thylacoleo
источник
Я разобрался с ответом два дня назад и разместил его здесь как новый ответ. Затем я также расширил и обновил веб-страницу graphpad.com, которую вы нашли. Я просто снова отредактировал эту страницу, добавив ссылку на файл Excel с данными о проблеме ( graphpad.com/faq/file/1226.xls ). Я не мог этого сделать, пока не получил разрешение от парня, который сгенерировал данные (он хочет быть анонимным, а данные смутно помечены).
Харви Мотульский