Часть III • Продвинутые возможности глубокого обучения с TensorFlow.js
8.3. Универсальный технологический процесс
машинного обучения
На текущий момент вы уже познакомились со всеми важными этапами проектиро
вания и обучения моделей МО, включая получение, форматирование, визуализацию
и ввод данных, узнали, как выбрать подходящую для набора данных топологию
модели и функции потерь, а также рассмотрели само обучение модели. Вы также
уже видели некоторые важнейшие типы некорректной работы модели, порой воз
никающие во время обучения: переобучение и недообучение. Так что самое время
окинуть взглядом все изученное и задуматься, какие процессы машинного обучения
моделей — общие для различных наборов данных. Полученная в результате абстрак
ция называется
универсальным технологическим процессом машинного обучения
(the
universal workflow of machine learning). Мы перечислим по очереди составляющие
этого технологического процесса и подробнее обсудим ключевые соображения для
каждого из шагов.
1.
Выяснить, является ли машинное обучение правильным подходом
. Вопервых,
необходимо обдумать, хорошо ли подходит машинное обучение для решения
поставленной задачи, и переходить к следующим шагам только в том случае,
если ответ на этот вопрос положительный. В некоторых случаях не основанный
на машинном обучении подход даст ничуть не худшие, а то и лучшие результаты
при меньших затратах. Например, потратив достаточно усилий на настройку
модели, можно научить нейронную сеть «предсказывать» сумму двух целых чи
сел по этим числам в виде текстовых входных данных (см. пример additionrnn
в репозитории tfjsexamples). Но это далеко не самое эффективное или надежное
решение данной задачи: вполне достаточно старой доброй операции сложения
на CPU.
2.
Сформулировать задачу машинного обучения и определить, что мы пытаемся
предсказать на основе имеющихся данных
. На этом шаге необходимо ответить на
два вопроса.
•
Данные какого вида у нас есть?
При обучении с учителем можно научиться
чтолибо предсказывать только при наличии маркированных обучающих
данных. Например, описанная ранее в главе модель предсказания погоды воз
можна лишь благодаря наличию набора данных Jenaweather. На этом этапе
ограничивающим фактором обычно является доступность данных. Если же
доступных данных недостаточно, необходимо собрать еще или, скажем, нанять
людей для маркирования вручную немаркированного набора данных.
•
О задаче какого типа идет речь?
Бинарной классификации, многоклассовой
классификации, регрессии или чемто еще? Именно тип задачи определяет
выбор архитектуры модели, функции потерь и т. д.
Перейти к следующему шагу нельзя, пока мы не определимся с входными и вы
ходными сигналами, а также используемыми данными. Необходимо отдавать
себе отчет в неявных гипотезах, принимаемых на этом шаге.
Do'stlaringiz bilan baham: |