Корректировка ковариат в анализе кривой ROC

20

Этот вопрос касается оценки пороговых значений в многомерном скрининговом вопроснике для прогнозирования двоичной конечной точки при наличии коррелированных шкал.

Меня спросили об интересе к контролю за ассоциированными подсчетами при разработке предельных баллов по каждому измерению шкалы измерений (личностных черт), которые могут использоваться для скрининга на алкоголизм. То есть, в данном конкретном случае, человек не был заинтересован в корректировке на внешние ковариаты (предикторы) - что приводит к (частичной) площади под кривой ROC с поправкой на ковариату, например (1-2) - но по существу на другие оценки из той же анкеты, потому что они соотносят друг друга (например, «импульсивность» с «поиском ощущений»). Это равносильно построению GLM, который включает в себя с левой стороны оценку интереса (для которой мы ищем отсечение) и другую оценку, рассчитанную по той же анкете, в то время как с правой стороны результатом может быть статус питья.

Чтобы прояснить (по запросу @robin), предположим, что у нас есть балла, скажем, (например, тревога, импульсивность, невротизм, поиск ощущений), и мы хотим найти пороговое значение (то есть «положительный случай», если , «отрицательный случай» в противном случае) для каждого из них. Мы обычно учитываем другие факторы риска, такие как пол или возраст, при разработке такого ограничения (используя анализ кривой ROC). Теперь, как насчет корректировки импульсивности (IMP) на пол, возраст и поиск ощущений (SS), поскольку известно, что SS коррелирует с IMP? Другими словами, у нас было бы предельное значение для ИМП, когда влияние возраста, пола и уровня тревоги устранено.Jзнак равно4ИксJTJИксJ>TJ

Помимо того, что отсечение должно оставаться максимально простым, мой ответ был

Что касается ковариат, я бы порекомендовал оценить AUC с корректировкой и без нее, просто чтобы посмотреть, увеличится ли прогнозная производительность. Здесь ваши ковариаты - это просто другие подкорки, определенные из того же инструмента измерения, и я никогда не сталкивался с такой ситуацией (обычно я настраиваюсь на известные факторы риска, такие как возраст или пол). [...] Кроме того, поскольку вас интересуют прогностические проблемы (то есть эффективность скрининга вопросника), вас также может заинтересовать оценка положительной прогностической ценности (PPV, вероятность пациентов с положительными результатами теста, которые правильно классифицированы) при условии Вы можете классифицировать предметы как «положительные» или «отрицательные» в зависимости от их подклассов в вашей анкете. Обратите внимание, однако,

Есть ли у вас более глубокое понимание этой конкретной ситуации со ссылкой на соответствующие документы, когда это возможно?

Ссылки

  1. Джейнс Х. и Пепе М.С. (2008). Поправка на ковариаты в исследованиях диагностических, скрининговых или прогностических маркеров: старая концепция в новых условиях . Американский журнал эпидемиологии , 168 (1): 89-97.
  2. Джейнс Х. и Пепе М.С. (2008). Приспособление ковариат в ROC-анализе . UW Biostatistics Working Paper Series , Бумага 322.
хл
источник
Я не эксперт, но мне показалось, что предложение «контролировать связанные подсчеты при разработке показателей отсечения для каждого измерения шкалы измерения» несколько эзотерично. Можете ли вы дать мне еще одну строку объяснения (в противном случае мне было трудно понять вопрос)?
Робин Жирар
@robin Да, в основном я имел в виду: у нас есть балла (например, тревога, импульсивность, невротизм, поиск ощущений), и мы хотим найти предельное значение (т.е. «положительный случай», если , «отрицательный случай» «иначе» для каждого из них. Мы обычно учитываем другие факторы риска, такие как пол или возраст, при разработке такого ограничения (используя анализ кривой ROC). Теперь, как насчет корректировки импульсивности (IMP) на пол, возраст и поиск ощущений (SS), поскольку известно, что SS коррелирует с IMP? Другими словами, у нас было бы предельное значение для ИМП, когда влияние возраста, пола и уровня тревоги устранено. Jзнак равно4TJИксJ>TJ
ЧЛ
Если конечная цель состоит в том, чтобы предсказать двоичное значение, учитывая [коррелированные] ответы на вопросы опроса, это очень похоже на стандартную проблему двоичной классификации. Было бы уместно думать об этом так? Или очень важно придумать «предельные значения» (о которых я ничего не знаю)?
DavidR
@DavidR Ну, идея состоит в том, чтобы выбрать предельное значение (читай, «субъект подвержен риску выше определенного значения»), которое сопровождается множеством предостережений со статистической точки зрения, но большинство клиницистов привыкли или предпочитают работать сюда. (Извините за то, что не заметил ваш комментарий ранее!)
chl

Ответы:

7

То, как вы представили анализ, на самом деле совсем не то, что я бы посоветовал вам подумать об этом. Прежде всего, легко показать, что если необходимо использовать отсечки, отсечки применяются не к отдельным признакам, а к общей прогнозируемой вероятности. Оптимальная отсечка для одного ковариата зависит от всех уровней других ковариат; это не может быть постоянным. Во-вторых, кривые ROC не играют никакой роли в достижении цели принятия оптимальных решений для отдельного предмета.

Для обработки коррелированных масштабов есть много методов сокращения данных, которые могут помочь. Одним из них является формальный анализ избыточности, где каждый предиктор, в свою очередь, нелинейно прогнозируется от всех других предикторов. Это реализовано в redunфункции в Hmiscпакете R. Кластеризация переменных, анализ главных компонентов и факторный анализ - это другие возможности. Но основной частью анализа, на мой взгляд, должно быть построение хорошей вероятностной модели (например, бинарной логистической модели).

Фрэнк Харрелл
источник
1
+1 за важное различие в индивидуальном и групповом решении. Я должен был ожидать вашего ответа, учитывая ваш ответ здесь или другой ваш ответ в списке рассылки medstats . Я также нашел ваш доклад о прямых измерениях диагностической полезности, основанной на диагностических моделях риска, особенно полезным в этом отношении.
ЧЛ
Обсуждение прямых измерений диагностической полезности, основанных на моделях диагностического риска, теперь можно найти здесь kc.vanderbilt.edu/quant/Seminar/HarrellPresentMay12.pdf
Epifunky,
3

Смысл статьи Джейнса Пепе о ковариатных скорректированных кривых ROC позволяет более гибко интерпретировать расчетные значения кривой ROC. Это метод стратификации кривых ROC среди определенных групп в интересующей популяции. Оцененная истинно положительная фракция (TPF; уравнение чувствительности) и истинно отрицательная фракция (TNF; уравнение специфичности) интерпретируются как "вероятность правильного результата скрининга, если статус заболевания равен Y / N среди лиц одного и того же [скорректированной переменной список]". На первый взгляд кажется, что вы пытаетесь улучшить свой диагностический тест, добавив больше маркеров в вашу панель.

Хорошим опытом для понимания этих методов было бы прочитать модель пропорциональных рисков Кокса и посмотреть книгу Пепе «Статистическая оценка медицинских тестов для классификации и ...». Вы заметите, что показатели надежности скрининга имеют много схожих свойств с кривой выживания, рассматривая подобранную оценку как время выживания. Так же, как модель Кокса учитывает стратификацию кривой выживания, они предлагают дать стратифицированные меры надежности.

Причина, по которой это важно для нас, может быть обоснована в контексте бинарной модели смешанных эффектов: предположим, что вы заинтересованы в прогнозировании риска стать наркоманом. SES оказывает настолько очевидное доминирующее влияние на это, что кажется глупым оценивать диагностический тест, который может быть основан на личном поведении, без какого-либо расслоения. Это потому, что [просто катитесь с этим], даже если у богатого человека проявляются маниакальные и депрессивные симптомы, они, вероятно, никогда не попробуют метамфетамин. Тем не менее, у бедного человека был бы гораздо больший повышенный риск, имеющий такие психологические симптомы (и более высокий балл риска). Грубый анализ риска показал бы очень низкую эффективность вашей прогностической модели, потому что одинаковые различия в двух группах не были достоверными. Однако, если вы стратифицированы (богатые против бедных),

Смысл ковариатной корректировки заключается в том, чтобы рассматривать различные группы как однородные из-за более низкой распространенности и взаимодействия в модели риска между различными слоями.

Adamo
источник
(+1) Это интересный ответ, большое спасибо. На момент написания этой статьи моей главной заботой было то, что предельные значения будут несколько «взаимозависимыми». Но я проверю книгу Пепе ( тем временем нашел здесь раздаточный материал ).
ЧЛ
Существуют проблемы с использованием одних и тех же данных для разработки и оценки медицинского теста, но это легко исправить. Вы должны рассмотреть какую-то перекрестную проверку или разделить данные на подмножества «обучения» и «проверки». Обычно это правильный подход к разработке диагностической / прогностической модели / модели прогнозирования риска.
AdamO