Я хотел бы рассчитать d Prime для задачи памяти, которая включает в себя обнаружение старых и новых элементов. У меня проблема в том, что у некоторых субъектов частота ударов равна 1 и / или частота ложных тревог равна 0, что делает вероятности 100% и 0% соответственно.
Формула д штрихом является d' = z(H) - z(F)
, где z(H)
и z(F)
являются Z трансформы скорости попадания и ложной тревоги, соответственно.
Чтобы вычислить z-преобразование, я использую функцию Excel NORMSINV (т.е. z(H)=NORMSINV(hit rate)
). Однако, если частота срабатывания или частота ложных срабатываний равны 1 или 0 соответственно, функция возвращает ошибку. Это потому, что z transform, как я понимаю, указывает область под кривой ROC, которая математически не допускает вероятности 100% или 0%. В этом случае я не уверен, как рассчитать d 'для субъектов с потолочным показателем.
Один веб-сайт предлагает заменить скорость 1 и 0 на 1 - 1 / (2N) и 1 / 2N, где N - максимальное количество попаданий и ложных срабатываний. На другом веб-сайте написано, что «ни H, ни F не могут быть 0 или 1 (если это так, отрегулируйте немного вверх или вниз)». Это кажется произвольным. У кого-нибудь есть мнение по этому поводу или я хотел бы указать мне на правильные ресурсы?
источник
Оба сайта предлагают одно и то же, но один из них предлагает способ последовательно выбирать величину корректировки. Это было приписано многим людям, но я не думаю, что кто-то знает, кто действительно придумал это первым. Разные поля имеют разные основополагающие книги или автора по обнаружению сигналов. Важно то, что выбранный вами метод является разумным.
Один из опубликованных вами методов обычно подразумевает, что если бы у вас был гораздо больший набор элементов (2N), вы бы смогли обнаружить хотя бы одну ошибку. Если это разумный способ думать о проблеме, то все готово. Я сомневаюсь, что это для теста памяти. В будущем вы, возможно, захотите поднять N, чтобы гарантировать, что это произойдет гораздо реже. Тем не менее, этот метод можно использовать, если рассматривать его по-другому. Вы корректируете гипотетическое среднее из двух прогонов одинакового количества элементов памяти. В этом случае вы говорите, что в другой серии эксперимента (при условии, что новые предметы или они забыли все старые) произошла ошибка. Или, проще говоря, вы просто выбираете половину между наивысшим несовершенным показателем, который вы можете измерить, и отличным показателем.
Это проблема без простого универсального решения. Первый вопрос, который вам нужно задать, заключается в том, считаете ли вы, что в вашем случае у вас есть действительно совершенная классификация. В этом случае ваши данные ваши данные. Если нет, то вы полагаете, что это просто изменчивость в выборке, вызывающая попадания на 100%. Как только вы решите, что это так, вы должны подумать о разумных способах составить оценку того, чем, по вашему мнению, вы являетесь. И поэтому вы должны спросить себя, что это на самом деле.
Самый простой способ определить, каким должен быть d ', - это посмотреть на другие данные в том же состоянии. Возможно, вы могли бы оценить, что точность для этого одного участника находится на полпути между следующим лучшим значением, которое у вас есть, и 100% (что может оказаться точно таким же, как и найденное вами значение). Или это может быть немного больше. Или это может быть просто равно лучшим значениям. Вы должны выбрать то, что вы считаете лучшим ответом на основе ваших данных. Здесь вам может помочь более конкретный вопрос.
Вы должны попытаться убедить себя, что это оказывает как можно меньшее влияние на критерий. В вашем случае корректировка попаданий и ТВ приведет к тому, что критерий вообще не сместится. Однако, если вы корректируете попадания, когда, скажем, FA = 0,2, тогда вы должны быть осторожны с тем, как эта корректировка повлияет на интерпретацию критерия. В этом случае вы как бы обязаны убедиться, что количество попаданий очень велико.
источник