При обучении нейронных сетей одним гиперпараметром является размер мини-пакета. Обычный выбор - 32, 64 и 128 элементов в каждой партии.
Существуют ли какие-либо правила / рекомендации, какими большими должны быть мини-партии? Какие-нибудь публикации, которые исследуют влияние на обучение?
neural-network
deep-learning
convnet
optimization
Мартин Тома
источник
источник
Ответы:
В « Обучении в больших пакетах для глубокого обучения: разрывы обобщения и резкие минимумы» есть пара интересных предложений:
Из моей магистерской диссертации : Отсюда и выбор размера мини-партии влияет:
Важно отметить гиперпараметрическое взаимодействие : размер пакета может взаимодействовать с другими гиперпараметрами, в частности с частотой обучения. В некоторых экспериментах это взаимодействие может затруднить выделение влияния размера партии только на качество модели. Другое сильное взаимодействие - ранняя остановка регуляризации.
Смотрите также
источник