В обсуждении: как создать кривую roc для бинарной классификации , я думаю, что путаница заключалась в том, что «двоичный классификатор» (который является любым классификатором, разделяющим 2 класса) был для Янга так называемым «дискретным классификатором» (который производит дискретные выходы 0/1 (например, SVM), а не непрерывные выходы, такие как ANN или байесовские классификаторы ... и т. д. Итак, обсуждение было о том, как строится ROC для "двоичных непрерывных классификаторов", и ответ заключается в том, что выходные данные сортируются по их оценкам, поскольку выходные данные являются непрерывными, и пороговое значение используется для получения каждой точки на кривой ROC.
Мой вопрос касается «двоичных дискретных классификаторов», таких как SVM, выходные значения равны 0 или 1. Таким образом, ROC выдает только одну точку, а не кривую. Я не понимаю, почему мы до сих пор называем это кривой? !! Можем ли мы еще поговорить о порогах? Как можно использовать пороги в SVM в частности? Как можно вычислить AUC? Играет ли здесь перекрестная проверка?
источник
Ответы:
Да, существуют ситуации, когда обычная рабочая кривая приемника не может быть получена и существует только одна точка.
SVM можно настроить так, чтобы они выводили вероятности членства в классе. Это будет обычное значение, для которого будет изменяться пороговое значение для получения кривой работы приемника .
Это то, что вы ищете?
Шаги в ROC обычно выполняются с небольшим числом тестовых случаев, а не с каким-либо влиянием на дискретное изменение ковариаты (в частности, вы получаете те же самые точки, если выбираете свои дискретные пороги так, чтобы для каждой новой точки изменялся только один образец) его назначение).
Непрерывное изменение других (гипер) параметров модели, конечно, создает наборы пар специфичности / чувствительности, которые дают другие кривые в системе координат FPR; TPR.
Интерпретация кривой, конечно, зависит от того, какое изменение породило эту кривую.
Вот обычный ROC (то есть запрос вероятностей в качестве выходных данных) для класса "versicolor" набора данных радужной оболочки:
Система координат того же типа, но TPR и FPR как функция параметров настройки γ и C:
FPR; TPR (γ, C = 1, порог вероятности = 0,5):
FPR; TPR (γ = 1, C, порог вероятности = 0,5):
Эти сюжеты действительно имеют значение, но значение определенно отличается от значения обычного ROC!
Вот код R, который я использовал:
источник
these plots do have a meaning
- в чем смысл этих сюжетов?источник
Кривая ROC отображает специфичность в зависимости от чувствительности, которая изменяется в зависимости от порога ковариации (которая может быть непрерывной или дискретной). Я думаю, что вы путаете ковариату с ответом и, возможно, не до конца понимаете, что такое кривая ROC. Это конечно кривая, если ковариата непрерывна, и мы смотрим на порог для ковариаты, постоянно меняющейся. Если ковариата является дискретной, вы все равно можете построить график как функцию непрерывного порога. Тогда кривая будет плоской с шагами вверх (или вниз) на порогах, которые соответствуют дискретным значениям ковариаты. Так что это относится к SVM и любым другим дискретным классификаторам.
Что касается AUC, так как у нас все еще есть ROC (оценочный), мы все еще можем вычислить площадь под ним. Я не уверен, почему вы имели в виду вопрос о перекрестной проверке. В контексте задач классификации перекрестная проверка используется для получения объективных или почти непредвзятых оценок коэффициентов ошибок для классификатора. Таким образом, это может войти в то, как мы оцениваем точки на РПЦ.
источник