Я нашел это объяснение одним Натаном Яном на Quora
Точность Top-N означает, что правильный класс попадает в вероятности Top-N для того, чтобы он считался «правильным». В качестве примера, предположим, у меня есть набор данных изображений
- Собака
- Кот
- Собака
- птица
- Кот
- Кот
- мышь
- пингвин
Для каждого из них модель будет предсказывать класс, который появится в котировках рядом с правильным классом.
- Собака Собака"
- Кот «Птица»
- Собака Собака"
- Птица «Птица»
- Кошка Кошка"
- Кошка Кошка"
- Мышь «Пингвин»
- Пингвин «Собака»
Точность Top-1 для этого составляет (5 правильных из 8), 62,5%. Теперь предположим, что я также перечисляю остальные классы, которые предсказывала модель, в порядке убывания их вероятностей (чем правее появляется класс, тем меньше вероятность, что модель думает, что изображение является классом tat).
- Dog “Dog, Cat, Bird, Mouse, Penguin”
- Cat “Bird, Mouse, Cat, Penguin, Dog”
- Dog “Dog, Cat, Bird, Penguin, Mouse”
- Bird “Bird, Cat, Mouse, Penguin, Dog”
- Cat “Cat, Bird, Mouse, Dog, Penguin”
- Cat “Cat, Mouse, Dog, Penguin, Bird”
- Mouse “Penguin, Mouse, Cat, Dog, Bird”
- Penguin “Dog, Mouse, Penguin, Cat, Bird”
Если мы возьмем для этого точность 3 лучших, то правильный класс должен быть только в первых трех прогнозируемых классах для подсчета. В результате, несмотря на то, что модель не справляется со всеми проблемами, точность ее топ-3 составляет 100%!