Глава 1. Глубокое обучение и JavaScript
39
из большого количества специализированных деревьев принятия отдельных решений.
Обучение на основе ансамблей
(ensembling, ensemble learning) — методика обучения
набора (то есть ансамбля) отдельных моделей ML и использование во время вывода
совокупности их выходных сигналов. На сегодняшний день градиентный бустинг —
один из лучших (а то и лучший) алгоритмов для работы с несенсорной информацией
(например, при обнаружении мошенничества с платежными картами). Наряду
с глубоким обучением его чаще всего используют на конкурсах по науке о данных,
например на конкурсах Kaggle.
Взлет, падение и новый взлет нейронных сетей,
а также причины всего этого
Основные концепции нейронных сетей сформировались еще в 1950х годах. Клю
чевые методики обучения нейронных сетей, в том числе метод обратного распро
странения ошибки, изобрели в 1980х. Однако долгое время, с 1980х до начала
2010х годов, нейронные сети были незаслуженно забыты научным сообществом,
частично вследствие популярности конкурирующих с ними методов, например
SVM, а частично изза отсутствия возможности обучать глубокие (многослойные)
нейронные сети. Но в 2010 году сразу несколько исследователей, все еще занимав
шихся нейронными сетями, осуществили несколько важных прорывов: группы
исследователей под руководством Джеффри Хинтона из Университета Торонто,
Йошуа Бенжио из Университета Монреаля, Ян Ле Куна из НьюЙоркского универ
ситета, а также исследователи из швейцарского Института исследований в области
ИИ Далле Молле (IDSIA). Они преодолели важные рубежи, в частности впервые
практически реализовали глубокие нейронные сети на графических процессорах
(GPU) и добились снижения частоты ошибок с примерно 25 % до менее чем 5 %
в задаче машинного зрения ImageNet.
Начиная с 2012 года глубокие
сверточные нейронные сети
стали одним из лучших
алгоритмов для всех задач машинного зрения (вообще говоря, они подходят для всех
задач на восприятие). В числе прочих задач машинного зрения на восприятие мож
но назвать распознавание речи. На крупных конференциях по машинному зрению
в 2015 и 2016 годах практически не встречалось докладов, в той или иной мере не свя
занных со сверточными нейронными сетями. В то же время глубокое обучение на
чали применять и для многих других типов задач, например обработки естественного
языка. Нейронные сети полностью вытеснили SVM и деревья принятия решений из
широкого диапазона приложений. Например, Европейская организация по вопросам
ядерных исследований (ЦЕРН) на протяжении нескольких лет использовала методы
на основе деревьев решений для анализа полученных от детектора ATLAS Большого
адронного коллайдера данных по элементарным частицам. Но ЦЕРН постепенно
перешел на использование глубоких нейронных сетей изза большего быстродействия
и простоты обучения на больших наборах данных.
Так что же выделяет глубокое обучение из шеренги существующих алгоритмов
машинного обучения? (См. перечень некоторых популярных методов машинного
40
Do'stlaringiz bilan baham: |