Эти типы вопросов могут зависеть от проблемы, но я попытался найти исследование, которое решает вопрос, имеет ли значение количество скрытых слоев и их размер (количество нейронов в каждом слое) или нет.
Итак, мой вопрос: действительно ли имеет значение, если, например, у нас есть 1 большой скрытый слой из 1000 нейронов против 10 скрытых слоев по 100 нейронов в каждом?
источник
Есть так много аспектов.
1. Тренировка: тренировка глубоких сетей - тяжелая работа из-за исчезающей (взрывающейся сзади) проблемы градиента. Поэтому создание нейронной сети 10x100 не рекомендуется.
2. Обученная производительность сети:
Поэтому более глубокие сети более «умны», но структура сети 10х100 - хороший выбор.
источник
Если решаемая задача линейно разделима, один слой из 1000 нейронов может работать лучше, чем 10 слоев с каждым из 100 нейронов. Если задача нелинейная и не выпуклая, вам нужны глубокие нейронные сети.
источник
Вывод первого скрытого слоя будет умножен на вес, обработан функцией активации в следующем слое и так далее. Однослойные нейронные сети очень ограничены для простых задач, более глубокие NN могут работать намного лучше, чем один уровень.
Однако не используйте больше, чем слой, если ваше приложение не достаточно сложное. В заключение, слой из 100 нейронов не означает лучшую нейронную сеть, чем 10 слоев по 10 нейронов, но 10 слоев - это нечто воображаемое, если вы не занимаетесь глубоким обучением. начните с 10 нейронов в скрытом слое и попробуйте добавить слои или добавить больше нейронов в тот же слой, чтобы увидеть разницу. обучение с большим количеством слоев будет проще, но потребуется больше времени для обучения.
источник