Как работают генеративные состязательные сети?

12

Я читаю о порождающих состязательных сетях (GAN), и у меня есть некоторые сомнения относительно этого. До сих пор я понимаю, что в GAN существует два разных типа нейронных сетей: один является порождающим ( ), а другой - дискриминационным ( ). Генеративная нейронная сеть генерирует некоторые данные, которые дискриминационная нейронная сеть оценивает на правильность. GAN обучается, передавая функцию потерь в обе сети.GD

Как дискриминационные ( ) нейронные сети изначально узнают, правильны ли данные, полученные с помощью или нет? Нужно ли сначала тренировать затем добавить его в GAN с помощью ?DGDG

Давайте рассмотрим мою обученную сеть, которая может классифицировать изображение с точностью 90%. Если мы добавим эту сеть в GAN, есть 10% -ная вероятность, что изображение будет неправильно классифицировано. Если мы обучим GAN с помощью этой сети, то будет ли она иметь ту же ошибку в 10% при классификации изображения? Если да, то почему GAN показывают многообещающие результаты?DDD

Eka
источник

Ответы:

4

Сравните сгенерированные и реальные данные

Все результаты, полученные G, всегда считаются «неправильными» по определению, даже для очень хорошего генератора.

Вы предоставляете дискриминирующую нейронную сеть с набором результатов, сгенерированных сетью генератора и реальных результатов из внешнего источника, а затем вы обучаете его различать, был ли результат получен генератором или нет - вы не сравниваете » Хорошие и плохие результаты, вы сравниваете реальные и полученные результаты.Dграмм

Это приведет к «взаимному развитию», так как научится находить функции, которые отделяют реальные результаты от сгенерированных, а научится создавать результаты, которые трудно отличить от реальных данных.Dграмм

Петерис
источник
2

Дискриминационная сеть ( ) учится на дискриминацию по определению - мы обеспечиваем его с истинным и сгенерированными данными, и пусть это научиться самостоятельно , как различать между ними.D

Поэтому мы ожидаем, что сеть улучшит способность сети генерировать все лучшие и лучшие изображения (или другие виды данных), поскольку она пытается «обмануть» сеть , создавая новые данные, которые больше похожи на «реальные данные». Речь идет не о точности сети на всех. Речь идет не об улучшении точности , а об улучшении способности компьютера генерировать более «правдоподобные» данные.DграммDD

Тем не менее, использование этого сценария может быть хорошим «неконтролируемым» способом улучшить классификационные возможности нейронных сетей, поскольку это заставляет модель генератора изучать лучшие свойства реальных данных и узнавать, как различать реальные характеристики и шум, используя гораздо меньше данных, необходимых для традиционной схемы обучения под наблюдением.

Дрор Хилман
источник