Мне было интересно, могут ли при некоторых обстоятельствах ANN работать лучше, если вы удалите некоторые соединения на них, например:
Построение одной сети ANN путем параллельного подключения двух многослойных сетей ANN A и B (одинаковые входные и выходные узлы) с добавлением нескольких «коммуникационных» соединений между скрытыми слоями A и B?
Можно ли получить лучшие результаты обобщения?
Используется ли это как-то на практике, или всегда используются только многоуровневые полностью подключенные сети?
classification
neural-networks
SlimJim
источник
источник
Как правило, небольшие и / или разреженные сети обобщаются лучше. Вы можете позволить вашему алгоритму обучения отсеять ненужные соединения в сети фиксированного размера, применив некоторую форму снижения веса, или вы можете применить алгоритм, который направлен на оптимизацию самой архитектуры / топологии сети путем удаления ненужных входных данных, скрытых узлов или соединений.
Посмотрите на эти ссылки для идей и отправных точек для дальнейших исследований, или посмотрите на использование эволюционных алгоритмов для проектирования, сокращения и оптимизации архитектур.
источник
В большинстве случаев, если вы удалите ненужные соединения, вы получите лучшую сеть. Легко перетянуть (перегрузить) сеть - в этом случае она будет плохо работать с набором данных проверки.
Обрезка ненужных соединений, скорее всего, уменьшит вероятность перетренированности. Пожалуйста, смотрите: http://en.wikipedia.org/wiki/Overfitting .
источник
Да, это возможно. Мы можем рассмотреть связь между вычислительными единицами, количеством скрытых слоев, объединений на скрытый слой и т. Д. В качестве гиперпараметров. Определить оптимальные значения этих параметров можно, проведя серию экспериментов.
Например:
Вы можете разделить ваш набор данных следующим образом: обучающий набор 60% данных, перекрестная проверка 20% данных, тестирование 20% данных,
Затем обучите свой NN, используя набор данных обучения и параметр настройки, используя набор данных перекрестной проверки.
Наконец, вы можете использовать свой набор данных тестирования для оценки производительности вашего NN.
источник