d простое с вероятностью попадания 100% и вероятностью ложной тревоги 0%

10

Я хотел бы рассчитать d Prime для задачи памяти, которая включает в себя обнаружение старых и новых элементов. У меня проблема в том, что у некоторых субъектов частота ударов равна 1 и / или частота ложных тревог равна 0, что делает вероятности 100% и 0% соответственно.

Формула д штрихом является d' = z(H) - z(F), где z(H)и z(F)являются Z трансформы скорости попадания и ложной тревоги, соответственно.

Чтобы вычислить z-преобразование, я использую функцию Excel NORMSINV (т.е. z(H)=NORMSINV(hit rate)). Однако, если частота срабатывания или частота ложных срабатываний равны 1 или 0 соответственно, функция возвращает ошибку. Это потому, что z transform, как я понимаю, указывает область под кривой ROC, которая математически не допускает вероятности 100% или 0%. В этом случае я не уверен, как рассчитать d 'для субъектов с потолочным показателем.

Один веб-сайт предлагает заменить скорость 1 и 0 на 1 - 1 / (2N) и 1 / 2N, где N - максимальное количество попаданий и ложных срабатываний. На другом веб-сайте написано, что «ни H, ни F не могут быть 0 или 1 (если это так, отрегулируйте немного вверх или вниз)». Это кажется произвольным. У кого-нибудь есть мнение по этому поводу или я хотел бы указать мне на правильные ресурсы?

A.Rainer
источник

Ответы:

13

Станислав и Тодоров (1999) хорошо обсуждают это под заголовком « Удар по частоте и ложная тревога от нуля до единицы» .

Они обсуждают плюсы и минусы нескольких методов борьбы с этими крайними ценностями, в том числе:

  • Используйте непараметрическую статистику, такую ​​как вместо (Крейг, 1979)d Ad

  • Агрегируйте данные по нескольким предметам до расчета статистики (Macmillan & Kaplan, 1985)

  • добавьте 0,5 к числу обращений и количеству ложных тревог и добавьте 1 к числу испытаний сигналов и количеству испытаний шума; окрестил логлинейный подход (Hautus, 1995)

  • Отрегулируйте только экстремальные значения, заменив значения 0 на а значения 1 на где - количество испытаний сигнала или шума (Macmillan & Kaplan, 1985)( n - 0,5 ) / n n0.5/n(n0.5)/nn

Выбор в конечном итоге за вами. Лично я предпочитаю третий подход. Первый подход имеет тот недостаток, что менее понятен для ваших читателей, которые гораздо лучше знакомы с . Второй подход может не подойти, если вы заинтересованы в поведении одного субъекта. Четвертый подход предвзят, потому что вы не одинаково обрабатываете данные.d Ad

Джефф
источник
MacMillan & Kaplan - это популярный справочник, но я считаю, что есть греческий или русский автор, который предшествовал им по тому же совету ... имя слишком длинное, чтобы я помнил. Мой быстрый взгляд на S & T заключается в том, что он не очень исчерпывающий, но он напоминает мне, что я, вероятно, ошибся, не упомянув A '. Конечно, как только вы это сделаете, вы должны объяснить, что на самом деле означает переход на непараметрический.
Джон
6

Оба сайта предлагают одно и то же, но один из них предлагает способ последовательно выбирать величину корректировки. Это было приписано многим людям, но я не думаю, что кто-то знает, кто действительно придумал это первым. Разные поля имеют разные основополагающие книги или автора по обнаружению сигналов. Важно то, что выбранный вами метод является разумным.

Один из опубликованных вами методов обычно подразумевает, что если бы у вас был гораздо больший набор элементов (2N), вы бы смогли обнаружить хотя бы одну ошибку. Если это разумный способ думать о проблеме, то все готово. Я сомневаюсь, что это для теста памяти. В будущем вы, возможно, захотите поднять N, чтобы гарантировать, что это произойдет гораздо реже. Тем не менее, этот метод можно использовать, если рассматривать его по-другому. Вы корректируете гипотетическое среднее из двух прогонов одинакового количества элементов памяти. В этом случае вы говорите, что в другой серии эксперимента (при условии, что новые предметы или они забыли все старые) произошла ошибка. Или, проще говоря, вы просто выбираете половину между наивысшим несовершенным показателем, который вы можете измерить, и отличным показателем.

Это проблема без простого универсального решения. Первый вопрос, который вам нужно задать, заключается в том, считаете ли вы, что в вашем случае у вас есть действительно совершенная классификация. В этом случае ваши данные ваши данные. Если нет, то вы полагаете, что это просто изменчивость в выборке, вызывающая попадания на 100%. Как только вы решите, что это так, вы должны подумать о разумных способах составить оценку того, чем, по вашему мнению, вы являетесь. И поэтому вы должны спросить себя, что это на самом деле.

Самый простой способ определить, каким должен быть d ', - это посмотреть на другие данные в том же состоянии. Возможно, вы могли бы оценить, что точность для этого одного участника находится на полпути между следующим лучшим значением, которое у вас есть, и 100% (что может оказаться точно таким же, как и найденное вами значение). Или это может быть немного больше. Или это может быть просто равно лучшим значениям. Вы должны выбрать то, что вы считаете лучшим ответом на основе ваших данных. Здесь вам может помочь более конкретный вопрос.

Вы должны попытаться убедить себя, что это оказывает как можно меньшее влияние на критерий. В вашем случае корректировка попаданий и ТВ приведет к тому, что критерий вообще не сместится. Однако, если вы корректируете попадания, когда, скажем, FA = 0,2, тогда вы должны быть осторожны с тем, как эта корректировка повлияет на интерпретацию критерия. В этом случае вы как бы обязаны убедиться, что количество попаданий очень велико.

Джон
источник
Спасибо за вашу точку зрения и обоснование, Джон. Это действительно помогает. Я должен добавить, что увеличение числа N является хорошим решением, но наша задача выполняется внутри сканера fMRI, и мы ограничены тем, сколько испытаний мы можем выполнить, прежде чем они начнут нервничать и испортят наши данные при движении.
А.Райнер
«Возможно, вы могли бы оценить, что точность этого одного участника находится на полпути между следующим вашим лучшим значением и 100% (что может оказаться точно таким же, как и найденное вами значение)», - это хороший совет. Это сохранит порядок оценки эффективности предмета.
А.Райнер