Глава 1. Глубокое обучение и JavaScript
33
Рис. 1.3.
Более подробная, по сравнению с рис. 1.2, схема парадигмы машинного обучения.
Технологический процесс машинного обучения включает два этапа: обучение и вывод. Обучение
представляет собой процесс автоматического подбора машиной правил преобразования данных
в ответы. Результаты этапа обучения — усвоенные правила, заключенные в обученной модели, —
образуют фундамент для этапа вывода. Вывод означает получение ответов для новых данных
на основе обученной модели
На основе обучающих данных и архитектуры модели в результате процесса обуче
ния формируются усвоенные правила. Они заключаются в обученной модели. Этот
процесс изменяет (или уточняет) эскиз модели так, чтобы выходные данные модели
становились все ближе и ближе к желаемым. Этап обучения может занимать от милли
секунд до дней, в зависимости от объема обучающих данных, сложности архитектуры
модели и быстродействия аппаратного обеспечения. Такое направление машинного
обучения — использование маркированных примеров для постепенного снижения
погрешности выходных данных модели — называется
обучением с учителем
(supervised
learning)
1
. Б
ó
льшая часть описанных в книге алгоритмов глубокого обучения относится
к обучению с учителем. После обучения модели усвоенные правила можно применять
к новым данным — тем, которые не участвовали в процессе обучения. Это второй этап,
этап вывода
. Он требует меньшего объема вычислений, чем этап обучения, поскольку:
1) вывод обычно производится с одним элементом входных данных (например, одним
изображением) за раз, в то время как обучение предполагает обработку всех обуча
ющих данных; 2) во время вывода не требуется вносить изменения в модель.
Усвоение представлений данных
Машинное обучение связано с усвоением информации о данных. Но
какая именно
информация усваивается в ходе обучения? Ответ: способ эффективного преобразо
вания данных или, другими словами, превращения старых представлений данных
в новое, приближающее нас к решению текущей задачи.
Прежде чем продолжать, разберемся, что такое представление. По существу, это
точка зрения на данные. На одни и те же данные можно взглянуть с разных сторон,
что ведет к разным их представлениям. Например, цветное изображение может за
1
Другое направление машинного обучения — обучение без учителя (unsupervised learning),
при котором используются немаркированные данные. Примерами обучения без учителя
могут служить кластеризация (clustering, поиск отдельных подмножеств примеров в на
боре данных) и обнаружение аномалий (anomaly detection, выяснение, достаточно ли
сильно отличается конкретный пример данных от примеров из обучающего набора).
34
Do'stlaringiz bilan baham: |