Статистический тест для положительной и отрицательной прогностической ценности

12

Я читал газету и увидел таблицу со сравнением между PPV (положительная прогностическая ценность) и NPV (отрицательная прогностическая ценность). Они сделали какой-то статистический тест для них, это эскиз таблицы:

PPV    NPV    p-value
65.9   100    < 0.00001
...

Каждая строка относится к конкретной таблице непредвиденных обстоятельств.

Какой тип проверки гипотезы они сделали? Благодарность!

Симона
источник

Ответы:

17

Предполагая перекрестную классификацию, подобную показанной ниже (здесь, для инструмента скрининга)

альтернативный текст

мы можем определить четыре показателя точности скрининга и прогнозирующей силы:

  • Чувствительность (se), a / (a ​​+ c), т. Е. Вероятность того, что скрининг обеспечит положительный результат при наличии заболевания;
  • Специфичность (sp), d / (b + d), т. Е. Вероятность того, что скрининг даст отрицательный результат, если болезнь отсутствует;
  • Положительная прогностическая ценность (PPV), a / (a ​​+ b), т. Е. Вероятность пациентов с положительными результатами теста, которые правильно поставили диагноз (как положительный);
  • Отрицательное прогностическое значение (NPV), d / (c + d), то есть вероятность пациентов с отрицательными результатами теста, которые правильно диагностированы (как отрицательные).

Каждые четыре показателя представляют собой простые пропорции, рассчитанные по наблюдаемым данным. Таким образом, подходящим статистическим тестом будет биномиальный (точный) тест , который должен быть доступен в большинстве статистических пакетов или во многих онлайн-калькуляторах. Проверенная гипотеза состоит в том, значительно ли отличаются наблюдаемые пропорции от 0,5 или нет. Однако я обнаружил, что более интересно предоставить доверительные интервалы, а не один критерий значимости, поскольку он дает информацию о точности измерения. В любом случае, для воспроизведения результатов, которые вы показали, вам нужно знать общие поля вашей двусторонней таблицы (вы указали только PPV и NPV в виде%).

В качестве примера предположим, что мы наблюдаем следующие данные (вопросник CAGE является проверочной анкетой на алкоголь):

альтернативный текст

тогда в R PPV будет рассчитываться следующим образом:

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831 

Если вы используете SAS, вы можете взглянуть на примечание об использовании 24170: как я могу оценить чувствительность, специфичность, положительные и отрицательные прогностические значения, ложноположительные и отрицательные вероятности и отношения правдоподобия? ,

Для вычисления доверительных интервалов используется гауссовское приближение, (1.96 - квантиль стандартного нормального распределения при или с %), используется на практике, особенно когда пропорции довольно малы или велики (что часто имеет место здесь). p=0,9751-α/2α=5p±1.96×p(1p)/np=0.9751α/2α=5

Для дальнейшего ознакомления, вы можете посмотреть на

Newcombe, RG. Двусторонние доверительные интервалы для одной пропорции: сравнение семи методов . Статистика в медицине , 17, 857-872 (1998).

хл
источник
Благодарю. Хорошо, я прочитал в самом начале статьи, что они использовали критерий хи-квадрат для всех категориальных переменных. Написанная классификационная таблица не относится к переменной, в частности, она является результатом задачи классификации. Это не очень понятно! Теперь я предполагаю, что они сделали классический тест на пропорции .. может быть, хи-квадрат ..
Симона
Я снова посмотрел на этот вопрос и увидел, что значение p не относится ни к PPV, ни к NPV, оно относится ко всей строке. Я думаю, что тест, который они прошли, должен быть связан со всей таблицей непредвиденных обстоятельств.
Симона
@Simone Итак, если я правильно вас понимаю, вы предлагаете авторам предоставить значения PPV и NPV, но дали значение p, соответствующее тесту глобальной ассоциации таблицы 2x2? Это связано с этим недавним вопросом, stats.stackexchange.com/questions/9464/… ?
chl
Да, это было бы связано с этим вопросом, если бы значение p было связано либо с PPV, либо с NPV. И в этом случае вы дали решение. Тест соответствует всей таблице 2х2, я никогда не узнаю, что это за тест!
Симона
1

Посмотри пожалуйста

Косинский, Анджей С. Взвешенная обобщенная статистика баллов для сравнения прогностических значений диагностических тестов. Статистика в области медицины http://dx.doi.org/10.1002/sim.5587, опубликованная онлайн: 22 августа 2012 г.

Анджей Косински
источник