Часть IV • Резюме и заключительное слово
z
z
Отображение изображений и вектора в изображение.
•
Виртуальная примерка одежды и косметики
(Virtual tryon for clothes and
cosmetic products) — отображение селфи пользователя и векторного пред
ставления косметического средства или предмета одежды в изображение
пользователя, на которого надета данная одежда или нанесена косметика.
z
z
Отображение данных временного ряда и вектора в данные временного ряда.
•
Перенос музыкального стиля
(Musical style transfer) — отображение партитуры
(например, произведения классической музыки в виде временного ряда нот)
и описания желаемого состояния (например, «джаз») в новую партитуру, на
писанную в этом стиле.
Как вы могли заметить, последние четыре категории в этом списке включают
смешанные типы входных данных. На современном этапе развития технологии,
когда все вокруг оцифровывается, а потому может быть представлено в виде тензо
ров, возможности глубокого обучения ограничиваются лишь вашим воображением
и наличием обучающих данных. И хотя возможны почти все виды отображений, но
не все. Мы обсудим в следующем разделе, на что глубокое обучение
не
способно.
13.2.5. Ограничения глубокого обучения
Спектр приложений, которые можно реализовать с помощью глубокого обучения,
практически неисчерпаем. В результате очень легко переоценить мощь глубоких ней
ронных сетей и чересчур оптимистично отнестись к перечню задач, которые они могут
решить. В этом разделе мы вкратце поговорим о некоторых текущих их ограничениях.
Нейронные сети видят мир не так, как люди
Пытаясь разобраться в глубоком обучении, важно не слишком
очеловечивать
его —
существует тенденция неправильно интерпретировать глубокие нейронные сети
как некую имитацию восприятия и мышления людей. Очеловечивать глубокие
нейронные сети, вне всякого сомнения, будет неправильно в нескольких отноше
ниях. Вопервых, воспринимая внешний стимул (например, изображение лица
девушки или изображение зубной щетки), человек не только воспринимает яркость
и цветовые закономерности входного сигнала, но и выделяет из него более глубокие
и важные концепты, отражаемые этими поверхностными закономерностями (на
пример, лицо молодой девушки или товар, связанный с гигиеной ротовой полости,
а также связи между ними). Глубокие нейронные сети работают не так. При об
учении модели, предназначенной для добавления подписей к изображениям, ото
бражать изображения в текстовый выходной сигнал не следует считать, что модель
«понимает» изображение подобно человеку. В некоторых случаях модель может
начать генерировать абсурдные подписи даже при незначительном отклонении от
представленной в обучающих данных разновидности изображений (см. рис. 13.3).
В частности, своеобразный, нечеловеческий способ обработки глубокими ней
ронными сетями входных данных иллюстрируется
состязательными примерами
Do'stlaringiz bilan baham: |