Глава 13. Резюме, заключительные слова и дальнейшие источники информации
525
10.
Проверка и оценка обученной модели
. Как мы обсуждали в разделе 12.1, необхо
димо проверить модель на как можно более свежем оценочном наборе данных
и определить, отвечает ли степень безошибочности предсказания заранее вы
бранному критерию для промышленной эксплуатации. Кроме того, необходимо
произвести углубленный анализ качества работы модели на различных срезах
(подмножествах) данных, чтобы выявить нежелательные систематические ошиб
ки и убедиться в отсутствии дискриминации (например, сильно отличающейся
степени безошибочности на различных срезах данных)
1
. И лишь если модель
удовлетворяет этим критериям оценки, следует переходить к последнему шагу.
11.
Оптимизация и развертывание модели
. Выполните оптимизацию модели для
сокращения ее размера и ускорения вывода. После чего можно произвести раз
вертывание модели в среде, предназначенной для выдачи результатов пользова
телю, например на вебстранице, в мобильном приложении или конечной точке
HTTPсервиса (см. раздел 12.3).
Это алгоритм обучения с учителем, применяемый для решения множества ре
альных задач. В этой книге также описывались технологические процессы и других
типов машинного обучения: переноса обучения (с учителем), обучения с подкре
плением (RL) и генеративного глубокого обучения. Технологические процессы
переноса обучения с учителем (глава 5) и обычного обучения с учителем совпадают,
разве что в основе архитектуры модели и шагов обучения лежит предобученная
модель, поэтому обучающих данных обычно нужно меньше, чем при обучении
с нуля. Цель генеративного глубокого обучения отличается от обучения с учителем,
а именно: необходимо создать фиктивные примеры данных, как можно больше на
поминающие настоящие. На практике существуют методики, позволяющие свести
обучение генеративных моделей к обучению с учителем, как мы видели в приме
рах VAE и GAN в главе 9. Постановка задачи RL, с другой стороны, совершенно
иная, так что и технологический процесс резко отличается — основную роль в нем
играют среда, агент, действия, структура вознаграждений и алгоритм или типы
используемых для решения задачи моделей. Основные понятия и алгоритмы RL
кратко описаны в главе 11.
13.2.2. Типы моделей и слоев в TensorFlow.js: краткий
справочник
Все многочисленные нейронные сети, описываемые в этой книге, можно разбить
на три семейства: плотносвязные сети (называемые также многослойными пер
цептронами (MLP)), сверточные сети и рекуррентные сети. Каждый практический
специа лист по глубокому обучению должен быть знаком с этими основными се
мействами сетей. Каждый из этих типов сетей подходит для своих входных данных:
архитектура сети (MLP, сверточной или рекуррентной) кодирует определенные
1
Дискриминация (fairness) в машинном обучении — лишь зарождающаяся сфера исследо
ваний; см. более подробное обсуждение по следующей ссылке: http://mng.bz/eD4Q.
526
Do'stlaringiz bilan baham: |