факторов вариативности
, которые объясняют
наблюдаемые данные. В этом контексте слово «фактор» означает просто источник
влияния, а не «сомножитель». Зачастую факторы – это величины, не наблюдаемые
непосредственно. Это могут быть ненаблюдаемые объекты или силы в физическом
мире, оказывающие влияние на наблюдаемые величины. Это могут быть также умо-
зрительные конструкции, дающие полезные упрощающие объяснения или логически
выведенные причины наблюдаемых данных. Их можно представлять себе как кон-
цепции или абстракции, помогающие извлечь смысл из данных, характеризуемых
высокой вариативностью. В случае анализа записи речи к факторам вариативности
относятся возраст и пол говорящего, акцент и произносимые слова. В случае анализа
изображения автомобиля факторами вариативности являются положение машины,
ее цвет, а также высота солнца над горизонтом и его яркость.
Источник трудностей в целом ряде практических приложений искусственного
интеллекта – тот факт, что многие факторы вариативности оказывают влияние аб-
солютно на все данные, доступные нашему наблюдению. Отдельные пиксели изобра-
жения красного автомобиля ночью могут быть очень близки к черному цвету. Форма
силуэта автомобиля зависит от угла зрения. В большинстве приложений требуется
разделить
факторы вариативности и отбросить те, что нам не интересны.
Разумеется, может оказаться очень трудно выделить такие высокоуровневые абст-
рактные признаки из исходных данных. Многие факторы вариативности, к примеру
акцент говорящего, можно идентифицировать, только если наличествует очень глу-
бокое, приближающееся к человеческому понимание природы данных. Но раз полу-
чить представление почти так же трудно, как решить исходную задачу, то, на первый
взгляд, обучение представлений ничем не поможет.
Глубокое обучение
решает эту центральную проблему обучения представлений,
вводя представления, выражаемые в терминах других, более простых представле-
ний. Глубокое обучение позволяет компьютеру строить сложные концепции из более
прос тых. На рис. 1.2 показано, как в системе глубокого обучения можно представить
концепцию изображения человека в виде комбинации более простых концепций –
углов и контуров, – которые, в свою очередь, определены в терминах границ.
Стохастическая максимизация правдоподобия
25
АВТО-
МОБИЛЬ
ЧЕЛОВЕК
ЖИ-
ВОТНОЕ
Выход (тип объекта)
Третий скрытый слой
(части объектов)
Второй скрытый слой
(углы и контуры)
Первый скрытый слой
(границы)
Видимый слой
(исходные пиксели)
Do'stlaringiz bilan baham: |