Какое значение имеет количество сверточных фильтров в сверточной сети?

16

Каково количество фильтров в слое свертки?
Как это число влияет на производительность или качество архитектуры? Я имею в виду, мы должны всегда выбирать большее количество фильтров? что хорошего в них? и как люди назначают различное количество фильтров для разных слоев? Я имею в виду, глядя на этот вопрос: как определить количество сверточных операторов в CNN?
В ответе указывается 3 слоя свертки с разным количеством фильтров и размеров, опять же в этом вопросе: количество карт характеристик в сверточных нейронных сетях из рисунка видно, что у нас есть 28 * 28 * 6 фильтров для первого слоя и 10 * 10 * 16 фильтров для второго слоя. Как они приходят с этими числами, это методом проб и ошибок? заранее спасибо

Rika
источник

Ответы:

8

Каково количество фильтров в слое свертки? - Мне обычно нравится думать о фильтрах как о детекторах функций. Несмотря на то, что это зависит от проблемной области, значение детекторов признаков интуитивно понятно - это количество функций (таких как ребра, линии, части объекта и т. Д.), Которые сеть может изучить. Также обратите внимание, что каждый фильтр генерирует карту объектов. Карты функций позволяют вам изучить объясняющие факторы в изображении, поэтому чем больше фильтров #, тем больше учится сеть (не обязательно хорошая постоянно - насыщенность и конвергенция имеют наибольшее значение)

Как это число влияет на производительность или качество архитектуры? - Я не думаю, что вы найдете хороший ответ на эти вопросы, так как мы все еще пытаемся формализовать то, что происходит внутри черного ящика DL. Интуитивно еще раз вы научитесь более устойчивой нелинейной функции, чем больше у вас банков фильтров, тем не менее производительность будет зависеть от типа задачи и характеристик данных. Обычно вы хотите знать, с какими данными вы имеете дело, чтобы определить # параметры в вашей архитектуре (включая фильтр). Сколько фильтров мне нужно? это больше похоже на вопрос, насколько сложными (особенно) являются изображения в моем наборе данных. Нет никакого формального понятия, связывающего # фильтры с производительностью. Все это экспериментально и итеративно. Много следов и ошибок.

Хенок Г.
источник
Хороший ответ, добавив к вышеупомянутым пунктам: CNN, однако, больше не являются черными ящиками. На самом деле вы можете увидеть функции, изученные на картах объектов. Количество фильтров, которые вы устанавливаете в слое, позволяет контейнерам ENOUGH подключаться к сети для изучения соответствующих функций (или их комбинаций). Какое количество достаточно -> зависит от набора данных. Скажем, сети CNN на уровне X нужны как минимум 24 карты функций для изучения важных функций, поэтому вы, скажем, 32, работаете над идеей, что вы даете сети передышку и позволяете ей решать самостоятельно, возможно, некоторые из 32 являются избыточными или слегка измененными.
MANU