Рис. 1. Архитектура предлагаемой модели нейронной сети
Ш аг 1.
Обнаружение лица на изображении с помощью функции Softmax:
L
cis
= У
l o g / + (1 - у) lo g (l - / ) .
Здесь провеяется выполнение следующего условия: если в окне
х
есть лицо, то
у = 1, в противном случае у = 0.
Ш аг 2.
Выполнение регрессии ограничительной рамки с более высокими
вероятностями:
L
r e g
= S( t ) — S ( t )
где
t
и
t
представляют соответственно прогнозируемые и достоверные (gound-
truth) результаты регрессии,
S
- оценка погрешности
L
±
.
Задача регрессии
ограничительных рамок состоит в том, чтобы определить следующие три
параметра:
t
w
= w / w ,
t
a
= (а +
0.5w —
а —
0.5w )/w ,
t
b
= (p +
0.5
w — b —
0 .5 w )/w ,
где
а
и
b
верхняя и левая координаты ограничительных рамок, а
w
- длина
ширины рамки,
a, b, w,
- основная истинная верхняя и левая координата и длина
ширины, соответственно.
Шаг 3.
Прогнозирование ориентации лиц кандидатов с помощью бинарной
классификации:
L
eal
= y \ o g g + ( 1 — y )
log( 1 —
д
) .
Здесь провеяется выполнение следующего условия: если изображение лица
х
направлено вверх, то
у = 1,
и наоборот, если оно направлено вниз, то
у = 0.
Н а основе приведенных выше формул модель может быть выражена
следующим образом:
32
L (F i(x )) ^
L ([f , t, g \)
Lcis
+
Xreg
•
Lreg
+
Xcai
•
Lcai,
где Are^ и
Xcai
- параметры, уравновешивающие различные погрешности.
В целом, цель НСПН на первом этапе можно выразить следующим образом:
L(F1) ^ m in.
Угол поворота
в 1
на первом этапе рассчитывается следующим образом:
в = { 00,
д > 05;
1
{1800,
д < 0.5,
где равенство
в 1 =
О0 означает, что лицо кандидата направлено вверх,
в 1 =
1800
означает, что изображение лица направлено вниз и его необходимо провернуть
на 18 0 0, чтобы привести его в вертикальное положение. В результате углы
поворота в плоскости уменьшаются с [ - 1 8 0 0,1 8 0 0] до [ - 9 0 0,9 0 0].
Для обучения НСПН на первом этапе использовались три типа обучающих
выборок: положительные, отрицательные и соминительные выборки. Эти
выборки были распределены по критерию IoU (Intersection over Union -
пересечение над объединением):
А п В
IoU = - — -
А и В
где
А
и
В
- определяемые моделью и предварительно определенные области
изображения соответственно.
Согласно значению IoU, положительные образцы включают окна выше 0,7,
отрицательные образцы включают окна ниже 0,3, а сомнительные образцы
включают окна от 0,4 до 0,7. Положительные и отрицательные образцы
помогают в обучении классификации на лица и не лица. Положительные и
сомнительные образцы помогают определить ограничительную рамку и
направление. Для положительных и сомнительных образцов они считаются
вертикальными, если их углы поворота в плоскости находятся в диапазоне [-650,
650 ], и направленными вниз, если они находятся в диапазоне [—1800, -1 1 5 0] или
[1150, 1800].
Второй этап.
На этом этапе в отличие от первого этапа направления окон-
кандидатов прогнозируется в трех угловых диапазонах:
[-90°, -45°],
[-45°, 45°], [45°, 90°]. Н а втором этапе выполняется операция регулировки
поворота с углом, предсказываемым по следующей формуле:
f - 9 0 0,id = 0;
62 = -
О0,
id = 1;
ч
9 0 0,id = 2,
id = a r g m a x g i, i = 0,2.
L
Здесь
g 0, д 1
и
g 2
прогнозируемые баллы направления для трех угловых
диапазонов. Лица-кандидаты поворачиваются на углы -9 0 0 , 00 и 900,
соответственно. После второго этапа диапазон углов поворота изображений лиц
в плоскости уменьшается с [—90°, 900] до [—45°, 450].
Третий этап.
После второго этапа углы поворота всех лиц-кандидатов в
плоскости корректируются в диапазоне [-450, 450].
33
Угол поворота 6
Do'stlaringiz bilan baham: |