Глава 5. Перенос обучения: переиспользование предобученных нейронных сетей
233
• В настоящих моделях обнаружения объектов в качестве функции потерь исполь
зуется не отдельная метрика
meanSquaredError
, а взвешенная сумма двух типов
функций потерь: 1) многомерной логистической функции перекрестной энтропии
для показателей вероятности, предсказываемых для классов объектов и 2) функ
ции потерь для ограничивающих прямоугольников наподобие
meanSquaredError
или
meanAbsoluteError
. Относительные веса для двух типов значений потерь
тщательно подбираются для выравнивания вкладов со стороны обоих источников
погрешности.
• Настоящие модели обнаружения объектов генерируют для каждого входного
изображения множество кандидатов на роль ограничивающих прямоугольников.
Далее лишние ограничивающие прямоугольники отсекаются, так что в итоговом
выходном сигнале остаются только те, что обладают максимальными показателями
вероятностей классов объектов.
• В некоторых настоящих моделях обнаружения объектов используются априор
ные знания о местоположении прямоугольников, ограничивающих объекты, —
эмпирические предположения о возможном расположении ограничивающих
прямоугольников в изображении, основанные на анализе большого числа марки
рованных реальных изображений. Благодаря этим априорным знаниям обучение
моделей ускоряется, поскольку начинается не с произвольных случайных зна
чений (как в примере simpleobjectdetection), а с некоего разумного начального
состояния.
Лишь небольшое количество настоящих моделей обнаружения объектов было пере
несено на TensorFlow.js. Например, поэкспериментировать с одной из лучших вы
можете, заглянув в каталог
coco-ssd
репозитория tfjsmodels. Чтобы увидеть ее в деле,
выполните следующие команды:
git clone https://github.com/tensorflow/tfjs-models.git
cd tfjs-models/coco-ssd/demo
yarn && yarn watch
Чтобы узнать больше о настоящих, используемых на практике моделях обнаружения
объектов, почитайте следующие посты блогов. Они касаются моделей SSD и YOLO
соответственно, архитектуры и методики дополнительной обработки которых сильно
различаются:
• Understanding SSD MultiBox — RealTime Object Detection In Deep Learning (Eddie
Forson):
http://mng.bz/07dJ
;
• Realtime Object Detection with YOLO, YOLOv2 and now YOLOv3 (Jonathan Hui):
http://mng.bz/KEqX
.
До сих пор мы работали с уже готовыми для исследований наборами данных
машинного обучения — отформатированными, очищенными благодаря кропотли
вой работе предыдущих исследователей и специалистов по машинному обучению.
Очищенными до такой степени, что мы могли сосредоточить внимание на модели
ровании и не волноваться о вводе и предварительной обработке данных, равно как
и об их корректности. Это справедливо для наборов данных MNIST и аудиоданных
234
Do'stlaringiz bilan baham: |