Этот вопрос для всех, кто знаком с исследованиями обнаружения объектов (особенно транспортных средств).
Я новичок в компьютерном зрении и запутался в классификаторах обнаружения объектов обучения. В частности, целью является обнаружение транспортного средства. Я уже несколько недель читаю литературу по обнаружению транспортных средств, но все еще в замешательстве.
Что меня смущает, так это оценка. Для оценки системы исследовательское сообщество обычно имеет эталонный набор данных, который можно использовать для тестирования данных. Но производительность системы также очень сильно зависит от данных, которые использовались для ее обучения, не так ли?
Так разве там нет обучающих наборов данных ? Это сделало бы для гораздо более единообразных сравнений методов. Кажется, я продолжаю находить документы, использующие наборы данных для оценки, но не упоминая, откуда они получили свои учебные данные.
источник
Ответы:
Обычно вы используете один и тот же набор данных (или, скорее, его части) для обучения и тестирования. И. е. Вы разделяете набор данных на тренировочный набор и тестовый набор. Общий метод оценки классификаторов в целом называется 10-кратной перекрестной проверкой. Вы разделяете свой набор данных 10 различными способами, так что 90% данных используются для обучения, а 10% данных используются для тестирования. Таким образом, вы получите 10 различных результатов точности, которые затем сможете использовать для тестирования статистической значимости, чтобы показать, что ваш классификатор лучше, чем кто-либо другой.
источник