ImageNet: что такое топ-1 и топ-5 ошибок?

38

В классификационных документах ImageNet показатели ошибок топ-1 и топ-5 являются важными единицами измерения успешности некоторых решений, но каковы эти коэффициенты ошибок?

В классификации ImageNet с глубокими сверточными нейронными сетями Крижевский и соавт. каждое решение, основанное на одной CNN (стр. 7), не имеет топ-5 ошибок, в то время как решения с 5 и 7 CNN (а также частота ошибок для 7 CNN лучше, чем для 5 CNN).

Означает ли это, что частота ошибок топ-1 является лучшей частотой ошибок для одной CNN?

Является ли частота ошибок топ-5 просто суммой ошибок пяти CNN?

daniel451
источник

Ответы:

53

[...] где частота ошибок топ-5 - это доля тестовых изображений, для которых правильная метка не входит в число пяти меток, которые режим считает наиболее вероятными.

Сначала вы делаете прогноз с использованием CNN и получаете полиномиальное распределение предсказанного класса ( ).ΣпсLassзнак равно1

Теперь, в случае с рейтингом топ-1 , вы проверяете, совпадает ли верхний класс (тот, который имеет наибольшую вероятность) с целевым ярлыком.

В случае оценки 5 лучших , вы проверяете, является ли целевой ярлык одним из ваших 5 лучших прогнозов (5 с наибольшей вероятностью).

В обоих случаях максимальный балл вычисляется как время, когда предсказанная метка совпадает с целевой меткой, деленная на количество оцененных точек данных.

Наконец, когда используются 5-CNN, вы сначала усредняете их прогнозы и следуйте той же процедуре для вычисления лучших 1 и 5 лучших результатов.

Яннис Ассаэль
источник
20

Ваш классификатор дает вам вероятность для каждого класса. Допустим, у нас были только «кошка», «собака», «дом», «мышь» в качестве классов (в этом порядке). Тогда классификатор дает что-то вроде

0.1; 0.2; 0.0; 0.7

в результате. Класс Top-1 - «мышь». Лучшие 2 класса - {мышь, собака}. Если правильным классом был «собака», он будет считаться «правильным» для точности Топ-2, но неверным для точности Топ-1.

Таким образом, в задаче классификации с возможных классов, каждый классификатор имеет 100% ТОП точность. «Нормальная» точность - топ-1.КК

Мартин Тома
источник