Я сталкиваюсь с коэффициентом Кости для сходства объема ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient ) и точности ( https://en.wikipedia.org/wiki/Accuracy_and_precision ).
Мне кажется, что эти две меры одинаковы. Какие-нибудь мысли?
descriptive-statistics
roc
accuracy
precision-recall
auc
RockTheStar
источник
источник
Ответы:
Это не одно и то же, и они часто используются в разных контекстах. Оценка Кости часто используется для количественной оценки эффективности методов сегментации изображения . Там вы комментируете некоторую область истинности на вашем изображении, а затем создаете автоматический алгоритм для этого. Вы проверяете алгоритм, вычисляя оценку Кости, которая является мерой того, насколько похожи объекты. Таким образом, это размер перекрытия двух сегментов, деленный на общий размер двух объектов. Используя те же термины, что и при описании точности, оценка костей :Игра в кости= 2 ⋅ количество истинных позитивов2 ⋅ количество ложных срабатываний + количество ложных срабатываний + количество ложных срабатываний
Таким образом, число истинных положительных результатов - это число, которое находит ваш метод, количество положительных результатов - это общее количество найденных положительных результатов и количество ложных срабатываний. положительные значения - это число отрицательных точек, которые ваш метод классифицирует как положительные.
Оценка Dice - это не только показатель количества найденных вами позитивов, но и штраф за ложные срабатывания, обнаруженные методом, аналогично точности. так что это больше похоже на точность, чем точность. Единственным отличием является знаменатель, в котором у вас есть общее количество позитивов, а не только позитивов, найденных методом. Таким образом, оценка Dice также штрафует за положительные результаты, которые ваш алгоритм / метод не смог найти.
Edit: В случае сегментации изображений, давайте предположим , что у вас есть маска с землей истиной, давайте называть маскуA как вы предлагаете. Таким образом, маска имеет значения 1 в пикселях, где есть что-то, что вы пытаетесь найти, и еще ноль. Теперь у вас есть алгоритм для генерации изображения / маски В , который также должен быть двоичным изображением, т.е. вы создаете маску для вашей сегментации. Тогда у нас есть следующее:
Если вы делаете это для публикации, напишите Dice с большой буквы D, потому что она названа в честь парня по имени Dice.
РЕДАКТИРОВАТЬ: Относительно комментария об исправлении: я не использую традиционную формулу для вычисления коэффициента кости, но если я перевожу его в нотацию в другом ответе, он становится:
Что эквивалентно традиционному определению. Более удобно написать это так, как я написал изначально, чтобы сформулировать формулу в терминах ложных срабатываний. Обратная косая черта - это установленный минус.
источник
Коэффициент Dice (также известный как индекс сходства Dice) такой же, как у F1 , но он не такой же, как точность. Основным отличием может быть тот факт, что точность учитывает истинные негативы, в то время как коэффициент Кости и многие другие показатели просто обрабатывают истинные негативы как неинтересные значения по умолчанию (см . Основы оценки классификатора, часть 1 ).
Насколько я могу судить, коэффициент Кости не вычисляется так, как описано в предыдущем ответе , который фактически содержит формулу для индекса Жакара (также известного как «пересечение над объединением» в компьютерном зрении).
Коэффициент Дайса и индекс Жакара монотонно связаны, и индекс Тверского обобщает их оба, чтобы узнать больше об этом, см. Сходство множеств F-Score, Dice и Jaccard .
Коэффициент Кости также является средним гармоническим значением Чувствительности и Точности, чтобы понять, почему он имеет смысл, прочитайте. Почему F-мера является средним гармоническим, а не средним арифметическим мер Точности и Напоминания? ,
Чтобы узнать больше о многих терминах в этом ответе и их отношениях, см. Оценка двоичных классификаторов .
источник