Вопросы с тегом «computer-vision»

22
Как рассчитать mAP для задачи обнаружения для PASCAL VOC Challenge?

Как рассчитать mAP (среднее значение точности) для задачи обнаружения для таблиц лидеров Vascal Pascal? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Там сказано - на странице 11 : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf Средняя точность...

18
В чем разница между Inception v2 и Inception v3?

В статье « Пройдя глубже с извилинами» описывается GoogleNet, в которой содержатся оригинальные начальные модули: Переход к началу v2 заключался в том, что они заменили свертки 5x5 на две последовательные свертки 3x3 и применили объединение: В чем разница между Inception v2 и Inception...

17
Что означает нотация mAP @ [. 5: .95]?

Для обнаружения общий способ определить, было ли одно предложение объекта правильным, является Пересечением по Объединению (IoU, IU). Он берет набор предложенных пикселей объекта и набор истинных пикселей B объекта и вычисляет:AAAВВB IoU(A,B)=A∩BA∪BIoU(A,B)=A∩BA∪BIoU(A, B) = \frac{A \cap B}{A \cup...

13
Почему в свертках всегда используются нечетные числа в качестве filter_size

Если мы посмотрим на 90-99% статей, опубликованных с использованием CNN (ConvNet). Подавляющее большинство из них использует размер фильтра нечетных чисел : {1, 3, 5, 7} для наиболее часто используемых. Эта ситуация может привести к некоторой проблеме: при таких размерах фильтров операция свертки...

11
В чем разница между дилатацией и деконволюцией?

Эти две операции свертки очень распространены в глубоком обучении прямо сейчас. Я читал о расширенном сверточном слое в этой статье: WAVENET: ОБЩАЯ МОДЕЛЬ ДЛЯ СЫРЬЕГО АУДИО и Деконволюция в этой статье: полностью сверточные сети для семантической сегментации Оба, кажется, улучшают изображение, но в...

11
Существуют ли хорошие готовые языковые модели для Python?

Я создаю прототип приложения и мне нужна языковая модель для вычисления недоумения в некоторых сгенерированных предложениях. Есть ли в Python обученная языковая модель, которую я могу легко использовать? Что-то простое, как model = LanguageModel('en') p1 = model.perplexity('This is a well...

10
Как я могу определить, был ли фотоснимок?

Я хотел бы проверить файлы JPG, если они были изменены для изменения содержимого. Что я считаю НЕ фотоделал: Обрезка вращающийся (Масштабирование) Разрешение изображения Смартфоны могут автоматически изменять Что я считаю фотошопом: Добавление нового изображения поверх частей старого изображения...

10
Неуправляемая сегментация изображения

Я пытаюсь реализовать алгоритм, где дано изображение с несколькими объектами на плоской таблице, желательным является вывод масок сегментации для каждого объекта. В отличие от CNN, целью здесь является обнаружение объектов в незнакомой среде. Каковы лучшие подходы к этой проблеме? Кроме того, есть...

9
Существуют ли исследования, которые изучают отсев против других регуляризаций?

Существуют ли опубликованные статьи, в которых показаны различия в методах регуляризации для нейронных сетей, предпочтительно в разных областях (или, по крайней мере, в разных наборах данных)? Я спрашиваю, потому что у меня сейчас есть ощущение, что большинство людей, похоже, используют только...

9
количество параметров для сверточных слоев

В этой высоко цитируемой статье авторы приводят следующую дискуссию о количестве весовых параметров. Мне не очень понятно, почему у него параметров. Я думаю, что это должно быть 49 C, поскольку каждый из входных каналов C использует один и тот же фильтр, который имеет 49 параметров.49 С249C249C^249...