Bog'liq Цэй Ш., Байлесчи С., и др. - JаvaScript для глубокого обучения (Библиотека программиста) - 2021
Часть I • Актуальность и основные понятия
обучения, не связанных с нейронными сетями, в инфобоксе 1.1). Основная причина
подобного успеха нейронных сетей заключается в более высоком их быстродей
ствии для ряда задач. Но это не единственная причина. Глубокое обучение также
упрощает решение задач, поскольку автоматизирует наиболее важный и трудный
шаг технологического процесса машинного обучения:
проектирование признаков (feature engineering).
Предшествовавшие нейронным сетям методы машинного обучения — неглубокое
обучение — включали лишь преобразование входных данных в одно или два после
довательных пространства представлений обычно путем простых преобразований
наподобие многомерных нелинейных проекций (ядерные методы) или деревьев
принятия решений. Но подобные методики чаще всего не позволяют получить
изощренные представления, необходимые для сложных задач. Поэтому исследо
вателям данных приходилось прикладывать немалые усилия, чтобы приспособить
имеющиеся входные данные к обработке с помощью подобных методов: нужно было
вручную проектировать подходящие слои представлений для своих данных. Этот
процесс и называется
проектированием признаков . Глубокое обучение же автома
тизирует этот этап: с помощью DL можно усвоить все признаки за один проход,
а не проектировать их самостоятельно. Благодаря этому технологические процессы
машинного обучения существенно упрощаются, а хитроумные многоэтапные кон
вейеры зачастую заменяются одной простой сквозной моделью глубокого обучения.
Благодаря автоматизации проектирования признаков глубокое обучение делает
машинное обучение менее трудоемким и более ошибкоустойчивым, таким образом
убивая одним выстрелом двух зайцев.
Глубокое обучение отличается двумя существенными нюансами того, как про
исходит усвоение данных. Вопервых, формирование все более сложных пред
ставлений выполняется инкрементно, послойно. Вовторых, эти промежуточные
инкрементные представления усваиваются совместно, каждый из слоев обновля
ется таким образом, чтобы учитывать потребности представления как уровнем
выше, так и уровнем ниже. Благодаря этим двум свойствам глубокое обучение
обрело намного б
ó
льшую популярность, чем все предыдущие подходы к машин
ному обучению.
1.1.4. Почему глубокое обучение?
И почему именно сейчас?
Если основные идеи и базовые методы нейронных сетей существовали еще в 1980х,
почему революция глубокого обучения началась только после 2012го? Что поменя
лось за эти три десятилетия? В целом технический прогресс в области машинного
обучения определяют три движущие силы:
z
z
аппаратное обеспечение;
z
z
наборы данных и тесты производительности;
z
z
усовершенствование алгоритмов.
Рассмотрим эти факторы по очереди.