Методы повышения показателей качества фильтрации dlp-систем на основе предметно-ориентированной морфологической модели естественного языка



Download 1,32 Mb.
Pdf ko'rish
bet22/47
Sana22.02.2022
Hajmi1,32 Mb.
#102152
1   ...   18   19   20   21   22   23   24   25   ...   47
Bog'liq
Диссертация

Общее описание DLP-систем 
DLP-системами (от англ. Data Loss Prevention, Data Leak Prevention или Data 
Leakage Protection) принято называть класс решений, предназначенных для 
предотвращения утечек информации в информационных системах. 
DLP-системы строятся на анализе потока данных, пересекающих периметр 
защищаемой информацонной системы. При детектировании в этом потоке 
конфиденциальной информации срабатывает активная компонента системы, и 
передача сообщения блокируется. [24] 
Общая схема работы DLP-системы выглядит следующим образом: 
Подсистема сбора 
данных
Подсистема 
анализа
Подсистема 
уведомления
Поток 
данных
Внешняя по отношению к 
защищаемым данным 
среда
Рис. 2.1.4. Общая схема DLP-системы 
Подсистема сбора данных предназначена для выделения и преобразования в 
единый формат анализируемой информации из всех потоков данных C, а также 
информации о поведении пользователей. 
Подсистема анализа определяет возможность передачи анализируемого 
сообщения в среду, которая является внешней по отношению к защищаемым 
данным. 
Подсистема уведомления предназначена для уведомления заинтересованных 
лиц (как минимум, офицеров безопасности) о некоторых попытках передачи 
защищаемой информации во внешнюю по отношению к защищаемым данным 
среду. 
Общая схема подсистемы анализа выглядит следующим образом: 


53 
Анализ меток 
секретности
Статистический 
анализ
Морфологический 
анализ
Анализ по 
регулярным 
выражениям
Анализ по 
цифровым 
отпечаткам
Другие методы 
анализа
Рис. 2.1.5. Общая схема подсистемы анализа DLP-системы 
Подаваемые на вход подсистеме анализа данные разделяются на сообщения, 
для которых метки секретности заранее определены и уже известны, и на 
сообщения, уровень секретности которых еще не определен. 
Решение по первой группе сообщений принимается достаточно просто, на 
основе имеющейся метки секретности. 
Для принятия решения по второй группе сообщений, для которых уровень 
секретности еще не определен, необходимо провести анализ. Для этого 
используются ряд статичтических методов анализа текстов естественного языка, 
методы, основанные на морфологическом анализе передаваемых сообщений, а 
также методы, основанные на регулярных выражениях, цифровых отпечатках и 
т.д.
Перечисленные методы имеют различные показатели полноты и точности 
поиска защищаемых данных в передаваемых сообщениях. Естественно-языковые 
сообщения, обрабатываемые в корпоративных ИС, могут содержать защищаемую 
информацию как в исходном виде (так, как она хранится в виде документов и 
прочих носителей защищаемой информации), так и в измененном – 


54 
преобразованном в другую формулировку, содержащему сокращения, 
специфические для отрасли компании термины и жаргонные выражения и т.д. 
Для решения задачи выявления DLP-системой угрозы утечки конфиденциальной 
информации в этом случае необходимо использование методов, позволяющих 
выявить попытку передачи защищаемой информации как в исходном, так и в 
изменненном виде. Таким образом, для выявления угрозы утечки 
конфиденциальной информации в современных ИС DLP-системы наиболее 
целесообразно использовать аналитические методы, которые основаны на 
морфологическом анализе передаваемых сообщений.
Кроме того, при передаче защищаемой информации в измененной 
формулировке статистический метод, а также методы анализа по цифровым 
отпечаткам и регулярным выражениям не применимы, поскольку не учитывают 
синтаксические и семантические особенности ЕЯ. 
В разделе 1.1 (Основные модели обработки естественно-языковой 
информации в DLP-системах) показано, что последний этап морфологического 
анализа – этап семантического анализа – недостаточно обеспечен теорией и 
практикой. В связи с этим для повышения показателей полноты и точности 
обнаружения угрозы утечки конфиденциальной информации DLP-системой 
необходимо развить и доработать используемые методы морфологического 
анализа. 

Download 1,32 Mb.

Do'stlaringiz bilan baham:
1   ...   18   19   20   21   22   23   24   25   ...   47




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish