Усреднение точности и отзыв при использовании перекрестной проверки

11

Я выполнил классификацию с использованием нескольких классификаторов для данных, помеченных для двух классов, и использовал пятикратную перекрестную проверку. Для каждого сгиба я вычислял tp, tn, fp и fn. Затем я рассчитал точность, точность, отзыв и F-показатель для каждого теста. Мой вопрос заключается в том, что, когда я хочу усреднить результаты, я взял среднее значение точности, но могу ли я также усреднить точность, вспомнить и F-показатель? Или это будет математически неправильно? PS Наборы данных, используемые в каждом сгибе, хорошо сбалансированы с точки зрения количества экземпляров на класс.

Спасибо.

Kalaji
источник
3
Я столкнулся с той же проблемой, что и при вычислении F-меры (среднее значение точности и отзыва) с использованием перекрестной проверки. В этой статье они фактически продемонстрировали, что вычисление F-меры по полному набору, а не усреднение, является менее предвзятым методом. Я надеюсь, что это может помочь
папафе
3
@markusian Пожалуйста, добавьте это как ответ! Это, безусловно, самая важная вещь на этой странице!
drevicko

Ответы:

2

F

F1=2precisionrecallprecision+recall
Fββ
Fβ=(1+β2)precisionrecall(β2precision)+recall
F

Просто имейте в виду, что существуют некоторые проблемы с использованием этих значений, чтобы сделать выводы об ошибке обобщения классификаторов. Например, тест между оценками для одного классификатора и оценками для другого классификатора будет слишком оптимистичным.tFF

Мэтт Краузе
источник
Да, я использовал первую формулу. Это означает, что усреднение F-показателя по различным тестам дает схожие результаты с усреднением точности и повторного вызова, а затем вычисление F-показателя по ним. Я попробовал это на результатах, которые я имею, и это было почти то же самое. Спасибо.
Каладжи