Выбор архитектуры нейронной
сети для классификации дорожных
знаков
После того как дорожные знаки ло
-
кализованы, необходимо их класси
-
фицировать. Т.к. для достижения этой
цели были выбраны свёрточные ней
-
ронные сети, то нужно подготовить
базу для обучения, выбрать архитекту
-
ру нейронной сети и обучить нейрон
-
ную сеть [5].
Сверточная нейронная сеть состоит
из последовательности субдискрети
-
зирующих и сверточных слоев. Перед
выходным слоем добавляется один
или несколько полносвязных слоев,
которые решают задачу классифика
-
ции. Также на работу сети очень силь
-
но влияет количество карт на каждом
слое.
Входные данные для сверточной
сети представляют собой полутоновые
изображения. От размера зависит вы
-
числительная сложность и точность. В
работе были использованы изображе
-
ния размером 32х32.
НАУКА БЕЗ ГРАНИЦ • № 5(45) 2020
тЕХНИчЕсКИЕ НАУКИ
80
Сверточный слой представляет на
-
бор карт признаков, у каждой карты
есть синаптическое ядро. От количе
-
ства карт также зависит качество рас
-
познавания и скорость работы сети.
Наиболее популярное решение – связь
одной карты из предыдущего слоя с
двумя картами сверточного слоя.
Ядро используется как окно, с по
-
мощью которого находят нужные
признаки на изображении. Размер
ядра, как правило, берут в пределах
от 3х3 до 7х7. Большое ядро ведет к
увеличению связей между нейрона
-
ми, что усложняет сеть, в то же время
маленькое ядро может не выделить
какие-либо признаки. Размер ядра
выбирается таким, чтобы размер карт
сверточного слоя был четным, это по
-
зволяет не терять информацию при
уменьшении размерности в подвыбо
-
рочном слое.
Ранее упоминалась важная особен
-
ность сверточной сети – локальность.
Локальность обеспечивается с помо
-
щью небольшого числа связей меж
-
ду нейронами. Таким образом общие
веса позволяют сократить число свя
-
зей и находить один и тот же признак
по всей области изображения.
Количество карт в подвыборочном
слое совпадает с предыдущим слоем.
Задача этого слоя – уменьшение раз
-
мерности карт предыдущего слоя.
Если на предыдущей операции сверт
-
ки уже были выявлены некоторые при
-
знаки, то для дальнейшей обработки
настолько подробное изображение
уже не нужно, и оно уплотняется до
менее подробного. Также отсеивание
ненужных деталей позволяет бороться
с переобучением.
В отличие от сверточного слоя, при
сканировании ядром подвыборочного
слоя окно не пересекается. Таким об
-
разом удается уменьшить карты свер
-
точного слоя в 2 раза, так как, чаще
всего, каждая карта имеет ядро 2х2.
Из двух элементов выбирается макси
-
мальный.
Цель же последнего слоя заключа
-
ется в классификации. Как правило,
для этого используют многослойный
персептрон.
Нейроны каждой карты предыду
-
щего подвыборочного слоя связаны с
одним нейроном скрытого слоя. Та
-
ким образом число нейронов скрытого
слоя совпадает с числом карт подвы
-
борочного слоя. Но также допустимы
более сложные связи.
Выходной слой связан со всеми
нейронами предыдущего слоя. Коли
-
чество нейронов соответствует коли
-
честву распознаваемых классов. Для
уменьшения количества связей и вы
-
числений для случая бинарной клас
-
сификации можно использовать один
нейрон и при использовании в каче
-
стве функции активации гиперболи
-
ческий тангенс.
Важной задачей при проектирова
-
нии нейронной сети является выбор
функции активации. Как правило,
используют сигмоидную и линей
-
ную функции. Сигмоида имеет ши
-
рокую популярность из-за простоты
интерпритации ее выхода, но при
этом у нее есть серьезный недоста
-
ток, связанный с ее насыщением, из-
за которого происходит затухание
градиентов. Поэтому в многослой
-
ных сетях часто вместе с сигмоидой
используют функцию ReLU, благо
-
даря линейности которой повыша
-
ется скорость сходимости градиент
-
ного спуска.
В результате была выбрана следую
-
щая архитектура сверточной нейрон
-
ной сети (табл.).
TECHNICAL SCIENCES
SCIENCE WITHOUT BORDERS NO. 5(45) 2020
81
Таблица
Do'stlaringiz bilan baham: |