Альманах научных работ молодых ученых
XLVII научной и учебно-методической конференции Университета ИТМО. Том 1
74
Ким Юлия Вячеславовна
Год рождения: 1997
Университет ИТМО, факультет безопасности информационных
технологий, кафедра проектирования и безопасности компьютерных
систем, студент группы № N3351
Направление подготовки: 10.03.01 – Информационная
безопасность
e-mail: yulia1344@gmail.com
Матвеева Анастасия Андреевна
Год рождения: 1998
Университет ИТМО, факультет безопасности информационных
технологий, кафедра проектирования и безопасности компьютерных
систем, студент группы № N3351
Направление подготовки: 10.03.01 – Информационная безопасность
e-mail: anastasiamatveevaitmo@gmail.com
УДК 004.932.1
МЕТОДЫ РАСПОЗНАВАНИЯ ОБРАЗОВ ПРИ НАРУШЕНИЯХ СЕМАНТИЧЕСКОЙ
ЦЕЛОСТНОСТИ ВИЗУАЛЬНОЙ ИНФОРМАЦИИ
Ким Ю.В., Матвеева А.А.
Научный руководитель – Викснин И.И.
В работе рассмотрены методы, применимые в компьютерном зрении и способствующие улучшению
качества распознавания образов, в частности, сохранению семантической
целостности визуальной
информации.
Ключевые слова: машинное обучение, компьютерное зрение, семантическая целостность,
визуальная информация, распознавание образов.
В течение последних нескольких десятков лет широкое распространение получило
машинное обучение. В работе освещен
раздел компьютерного зрения, а именно методы
повышения качества распознавания образов. Компьютерное зрение – это широкий пласт
теоретических изысканий и технических методик по распознаванию, отслеживанию и
классификации объектов. Авторы различных научных работ сходятся во мнении, что одной
из основных целей в области компьютерного зрения является
снижение процента ошибки
распознавания образов. Ошибкой распознавания образов в данной работе считается
ситуация, когда нужный объект на изображении не обнаруживается, либо обнаруживается
некорректно [1–10].
На основе изученных источников авторами была поставлена цель исследования – поиск
эффективных методов для распознавания образов в случае вероятности возникновения
нарушения семантической целостности. Реализация цели потребовала
решения следующих
задач:
1. рассмотрение целостности информации на основе ее концептуальных составляющих, а
именно синтаксической, семантической и прагматической целостности;
2. освещение этапов процесса распознавания образов.
Существует множество методов улучшения качества распознавания образов, но в
большинстве случаев они предлагаются отдельно друг от друга. Авторы хотели предложить
последовательность методов, которые возможно будет использовать на протяжении всего
процесса анализа изображения.
Исходя из этого, третьей задачей является:
3. поиск методов сохранения семантической целостности визуальной информации
относительно каждого этапа распознавания образов.
Альманах научных работ молодых ученых
XLVII научной и учебно-методической конференции Университета ИТМО. Том 1
75
Целостность информации можно подразделить на три составляющие: прагматическая,
синтаксическая и семантическая. Прагматическая целостность – это аспект целостности
информации, при котором излагаются факты, основанные на достоверных и полных
свидетельствах. Синтаксическая целостность – категория
целостности информации, при
которой обеспечивается донесение информации с использованием корректных конструкций
и структур. Семантическая целостность – категория, при которой не происходит нарушения
смыслового контекста информации. В процессе распознавания образов на изображении
существует вероятность, что объект будет распознан неверно, поэтому семантическая
целостность в области компьютерного зрения играет наиболее существенную роль.
Процесс распознавания образов состоит из трех основных этапов:
1. подготовка
изображения к анализу;
2. обработка визуальной информации;
3. классификация объектов на изображении.
Нарушение семантической целостности визуальной информации может произойти по
следующим причинам:
– наличие шумов на изображении;
– размытие изображения;
– неверно подобранная обучающая выборка для классификатора;
– недостаточность обучающей выборки для классификатора.
На начальном этапе анализа изображения авторами предлагалось нормировать
изображение. Нормирование позволяет сделать изображение нечувствительным к
изменениям освещенности и осуществляется согласно формуле:
2
2
2
2
2
2
2
2
2
,
,
]
,
,
[
Do'stlaringiz bilan baham: