Санкт-Петербургский национальный исследовательский университет
информационных технологий, механики и
оптики
На правах рукописи
Лапшин Сергей Владимирович
МЕТОДЫ ПОВЫШЕНИЯ ПОКАЗАТЕЛЕЙ КАЧЕСТВА ФИЛЬТРАЦИИ
DLP-СИСТЕМ НА ОСНОВЕ ПРЕДМЕТНО-ОРИЕНТИРОВАННОЙ
МОРФОЛОГИЧЕСКОЙ МОДЕЛИ ЕСТЕСТВЕННОГО ЯЗЫКА
Специальность 05.13.19 – Методы и системы защиты информации,
информационная
безопасность
Диссертация на соискание ученой степени
кандидата
технических наук
Научный руководитель
д.т.н. Лебедев И.С.
Санкт-Петербург
2014
Оглавление
Оглавление ....................................................................................................................... 2
Список использованных сокращений ........................................................................... 3
Введение ........................................................................................................................... 4
1.
Защита информационных систем от утечек информации ................................. 10
1.1.
Основные модели обработки естественно-языковой информации в DLP-
системах ...................................................................................................................... 10
1.2.
Основные методы борьбы с намеренными утечками информации ............ 37
1.3.
Постановка проблемы исследования .............................................................. 39
1.4.
Выводы .............................................................................................................. 40
2. Методы обнаружения угроз ИБ на основе
морфологической модели
естественного языка ...................................................................................................... 42
2.1 Модель угрозы утечки конфиденциальной информации, обрабатываемой в
современных информационных системах организаций ........................................ 42
2.2 Постановка задачи ............................................................................................... 57
2.3
Метод снижения числа ошибок первого и второго рода в морфологических
анализаторах DLP-систем ......................................................................................... 63
2.4 Метод предотвращения передачи
конфиденциальных ЕЯ собщений,
содержащих отсутствующие в словаре парадигмы слов ....................................... 68
2.5 Метод идентификации защищаемых данных в передаваемых сообщениях на
основе анализа связей в объектной модели естественного языка ........................ 72
2.6 Выводы .................................................................................................................. 82
3.
Сравнительный анализ ........................................................................................... 84
3.1
Оценка показателей качества предложенных решений ............................... 84
3.2
Оценка применимости предложенных решений ........................................... 94
3.3
Выводы ............................................................................................................ 100
Заключение .................................................................................................................. 104
Литература ................................................................................................................... 108