количество карт характеристик в сверточных нейронных сетях

16

При изучении сверточной нейронной сети у меня возникают вопросы относительно следующего рисунка.

1) C1 в слое 1 имеет 6 карт характеристик, означает ли это, что имеется шесть сверточных ядер? Каждое сверточное ядро ​​используется для генерации карты объектов на основе входных данных.

2) S1 в слое 2 имеет 6 карт характеристик, C2 имеет 16 карт характеристик. Как выглядит процесс получения этих 16 карт характеристик на основе 6 карт характеристик в S1?

введите описание изображения здесь

user3269
источник

Ответы:

13

1) C1 в слое 1 имеет 6 карт признаков, означает ли это, что имеется шесть сверточных ядер? Каждое сверточное ядро ​​используется для генерации карты объектов на основе входных данных.

Существует 6 сверточных ядер, каждое из которых используется для генерации карты объектов на основе входных данных. Еще один способ сказать, что есть 6 фильтров или наборы 3D-весов, которые я просто назову весами. То, что это изображение не показывает, что, вероятно, должно, чтобы прояснить это, - то, что у изображений обычно есть 3 канала, скажем, красный, зеленый и синий. Таким образом, веса, которые отображают вас от входа к C1, имеют форму / размерность 3x5x5, а не только 5x5. Те же 3-мерные веса, или ядро, применяются ко всему изображению 3x32x32 для создания 2-мерной карты объектов в C1. В этом примере имеется 6 ядер (каждое 3x5x5), так что в этом примере создается 6 карт объектов (каждое 28x28, поскольку шаг равен 1, а отступ равен нулю), каждое из которых является результатом применения ядра 3x5x5 ко входу.

2) S1 в слое 1 имеет 6 карт характеристик, C2 в слое 2 имеет 16 карт характеристик. Как выглядит процесс получения этих 16 карт характеристик на основе 6 карт характеристик в S1?

Теперь сделайте то же самое, что мы сделали в первом слое, но сделайте это для слоя 2, за исключением того, что на этот раз количество каналов не 3 (RGB), а 6, шесть для количества карт / фильтров объектов в S1. Теперь есть 16 уникальных ядер, каждое из которых имеет форму / размер 6x5x5. каждое ядро ​​уровня 2 применяется ко всему S1 для генерации двумерной карты объектов в C2. Это делается 16 раз для каждого уникального ядра в слое 2, все 16, для генерации 16 карт характеристик в слое 2 (каждый 10x10, поскольку шаг равен 1, а заполнение равно нулю)

источник: http://cs231n.github.io/convolutional-networks/

Карсон Лам
источник