DeepMind заявляет, что их глубокая Q-сеть (DQN) была способна постоянно адаптировать свое поведение во время обучения игре в 49 игр Atari.
Изучив все игры с одной и той же нейронной сетью, мог ли агент играть в них все одновременно на «сверхчеловеческих» уровнях (всякий раз, когда он случайно отображался в одной из игр) или он мог быть хорош только в одной игре за раз, потому что переключение требуется переучиться?
Ответы:
Переключение требовало переучивания.
Также обратите внимание, что :
а также
источник
Переключение требует переучивания, в сети не было ни одного набора весов, который позволял бы ей хорошо играть во все игры. Это связано с катастрофической проблемой забвения.
Тем не менее, недавняя работа была проделана для преодоления этой проблемы:
«Преодоление катастрофического забвения в нейронных сетях», 2016
Документ: https://arxiv.org/pdf/1612.00796v1.pdf
источник