Изменение размера изображения и отступ для CNN

14

Я хочу обучить CNN распознаванию изображений. Изображения для обучения не имеют фиксированного размера. Я хочу, чтобы размер ввода для CNN был 50x100 (высота х ширина), например. Когда я изменяю размер изображения небольшого размера (например, 32x32) до входного размера, содержимое изображения слишком сильно растягивается по горизонтали, но для некоторых изображений среднего размера это выглядит нормально.

Как правильно изменить размеры изображений, избегая уничтожения контента?

(Я имею в виду заполнение изображений нулями до полного размера после изменения их размера до некоторой степени, сохраняя соотношение ширины и высоты. Было бы хорошо с этим методом?)

Odgiiv
источник

Ответы:

10

Этот вопрос о stackoverflow может помочь вам. Подводя итог, некоторые исследователи с глубоким изучением полагают, что заполнение большой части изображения не является хорошей практикой, поскольку нейронная сеть должна понять, что заполненная область не имеет отношения к классификации, и не должна знать, что если вы используйте интерполяцию, например.

Дэвид Масип
источник
5

У вас есть несколько вариантов:

Для маленьких изображений:

  • повышение с помощью интерполяции
  • дополнить изображение нулями

Если вы не можете сохранить соотношение сторон с помощью повышающей дискретизации, вы можете увеличить выборку, а также обрезать лишние пиксели в наибольшем измерении. Конечно, это приведет к потере данных, но вы можете многократно смещать центр вашего урожая. Это поможет вашей модели быть более надежной.


Для больших изображений:

  • Downsample
  • обрезать до вашего размера ввода

Наконец, если вы используете полностью сверточную сеть (FCN), вам не нужно изменять размер изображений.

TL; DR:

да, заполнение нулями является допустимым вариантом.

Бенджи Альберт
источник
если я обучил весовые коэффициенты для полностью сверточной сети, которая принимает сцепленные 3 видеокадра, как я могу использовать эти весовые коэффициенты для сети с такой же архитектурой, за исключением того, что размер входного сигнала увеличен до сцепленных 11 кадров? Я только делаю прогнозы, а не тренируюсь дальше. Мой вопрос здесь: datascience.stackexchange.com/questions/55737/…
mLstudent33
3

Вы можете сделать следующее: сначала изменить размеры изображений до определенной степени, а затем дополнить изображение со всех сторон, что может помочь в поддержании функций на изображении.

Рохит Джере
источник