50
В связи с этим, рассмотрим следующую классификацию передаваемых
данных:
Сообщения на естественном языке с употреблением
специализированных
терминов
Бинарные объекты
Бинарные объекты, в свою очередь, могут содержать в себе сообщения на
естественном языке и другие бинарные объекты. Уровень вложенности объектов
при этом не ограничен.
Защищаемая информация может содержаться как в сообщениях на
естественном языке, так и бинарных объектах.
Бинарные объекты могут быть модифицированы следующими способами:
Архивирование/шифрование
Разделение на части
Изменение формата
Сообщения на естественном языке могут
содержать в себе защищаемую
информацию, которая изменена различными способами:
Передана в другой формулировке
Передана с грамматическими и синтаксическими ошибками
Передана с использованием специфических терминов и оборотов
Переведена на другой естественный язык
Передана в другой кодировке
Преобразована с помощью транслитерации или других способов замены
символов
Преобразована перестановкой слов
Преобразована разделением
слов на части
Передана частями в различные моменты времени через различные каналы
51
Указанные способы могут сочетаться друг с другом в различных
комбинациях, а также сочетаться с различными способами модификации
бинарных данных.
При этом использование естественного языка приводит к тому, что при
автоматическом анализе возникают дополнительные трудности.
Перечислим
основные из них:
Проблема синонимии
Проблема омонимии
Устойчивые сочетания слов
Морфологические вариации
Проблема синонимии. Одно понятие может быть выражено различными
словами. В результате релевантные документы, в
которых используются
синонимы понятий, используемых в передаваемом сообщении, могут быть не
обнаружены системой.
Проблема омонимии и явлений «смежных с омонимией». Грамматические
омонимы – разные по значению слова, но совпадающие по написанию в
отдельных грамматических формах. Это могут
быть слова одной или разных
частей речи. Лексические омонимы – слова одной части речи, одинаковые по
звучанию и написанию, но разные по лексическому значению.
Устойчивые сочетания слов. Словосочетания могут иметь смысл отличный
от смысла, который имеют слова по отдельности.
Морфологические вариации. Во многих естественных языках слова имеют
несколько морфологических форм, различающихся по написанию [42].
Таким образом, утечкой является передача любого модифицированного
описанными выше способами сообщения либо бинарного
объкта по любому из
описанных выше каналов
c содержащих хотя-бы один защищаемый факт
i
получателю информации
, т.е. когда получатель не входит в множество
разрешенных получателей
A.