Глава 10. Генеративное глубокое обучение
409
В этом типе GAN со смешанными входными сигналами латентные пространства уже
не непрерывны относительно входных сигналов сети.
В данном разделе мы подробнее обсудим относительно простой тип GAN. А имен
но, поговорим о применении
вспомогательного классификатора
GAN (auxiliary
classifier GAN, ACGAN)
1
для уже знакомого нам набора данных рукописных цифр
MNIST. Благодаря этому мы получим модель, способную генерировать изображения
цифр, в точности напоминающие настоящие цифры набора MNIST. В то же время
мы сможем сами контролировать, к какому классу цифр (от 0 до 9) принадлежат сге
нерированные изображения, благодаря вспомогательному классификатору ACGAN.
Чтобы разобраться, как функционирует ACGAN, пройдемся по этому алгоритму
пошагово. Вопервых, мы расскажем, как работает основная часть ACGAN — GAN.
А затем опишем дополнительные механизмы, позволяющие задавать классы цифр.
10.3.1. Основная идея GAN
Как GAN обучается генерировать правдоподобные изображения? Благодаря взаи
модействию двух его составляющих:
генератора
(generator) и
дискриминатора
(discriminator). Можно провести аналогию генератора с фальсификатором, цель кото
рого — нарисовать высококачественные имитации картин Пикассо, а дискриминато
ра — с торговцем произведениями искусства, задача которого — отличить поддельные
картины Пикассо от подлинников. Фальсификатор (генератор) пытается создать
все более и более правдоподобные подделки, чтобы обмануть торговца картинами
(дискриминатор), а торговец картинами стремится все лучше и лучше анализиро
вать картины, чтобы
не
дать фальсификатору себя обмануть. Это соперничество
двух игроков и послужило источником эпитета «состязательная» в названии GAN.
Что любопытно, фальсификатор и торговец картинами в конечном итоге
помогают
друг другу совершенствовать навыки, несмотря на явное соперничество.
Изначально фальсификатор плохо подделывает картины Пикассо — изза случай
ных начальных значений весовых коэффициентов. В результате торговец картинами
(дискриминатор) быстро обучается различать настоящие и поддельные картины.
Важный нюанс работы алгоритма: каждый раз, принося новую картину торговцу,
фальсификатор получает подробную обратную связь (от торговца) о том, какие фраг
менты картины выглядят неправильно и как поменять картину, чтобы она стала более
правдоподобной. Фальсификатор усваивает и запоминает эту информацию, так что
в следующий раз приносит торговцу чуть лучше выглядящие картины. Этот процесс
повторяется многократно. Оказывается, если задать все параметры должным образом,
в итоге наш фальсификатор (генератор) станет настоящим мастером своего дела.
Конечно, в результате дискриминатор (торговец картинами) также станет мастером
своего дела, но обычно после обучения GAN нужен только генератор.
На рис. 10.10 приведена более подробная иллюстрация обучения дискрими
натора универсальной модели GAN. Для обучения дискриминатора необходим
1
Odena A., Olah C., Shlens J.
Conditional Image Synthesis with Auxiliary Classifier GANs //
submitted 30 Oct. 2016, https://arxiv.org/abs/1610.09585.
410
Do'stlaringiz bilan baham: |