Методы повышения показателей качества фильтрации dlp-систем на основе предметно-ориентированной морфологической модели естественного языка


 Вычисление функции определения похожести множеств связей



Download 1,32 Mb.
Pdf ko'rish
bet37/47
Sana22.02.2022
Hajmi1,32 Mb.
#102152
1   ...   33   34   35   36   37   38   39   40   ...   47
Bog'liq
Диссертация

2.5.5 Вычисление функции определения похожести множеств связей 
На последнем этапе предлагаемого метода необходимо вычислить функцию 
определения похожести 
множеств связей и
.
Напомним, что если 
, где 
– некая константа для данного 
, то считается что множество связей
похоже на одно из подмножеств 
множества связей 
. Применительно к анализу угрозы утечки защищаемой 
информации это говорит о наличии в передаваемом сообщении одного из 
защищаемых файтов I
Для вычисления функции 
воспользуемся аппаратом из области 
цифрового спектрального анализа. Для выявления сходства двух сигналов 
используется взаимокорреляционная функция (ВКФ). Для двух дискретных 
сигналов 
и ВКФ может быть определена по формуле: 

, (2.5.5.1) 
где n – целое число, положительное, отрицательное, или нуль. [36] 
Выбор ВКФ для рассчета функций похожести 
множеств связей 
и
сделан не случайно. Во-первых, эта функция решает поставленную задачу – 
определеяет «похожесть» функций. Во-вторых, такой способ является быстрым (в 
сравнении с задачей определения изоморфизма графов для «классического» 
подхода семантического анализа) за счет возможности использования метода 
быстрого преобразования Фурье (БПФ). 
Надо отметить, что множества связей 
и
в том виде, как они описаны в п. 
2.5.4 для рассчета функций похожести 
не подходят.
Во-первых, ВКФ оперирует совокупностями отсчетов, следующих во 
времени с одинаковым интервалом. Для этого введем последовательность 

дополняющее 
нулевыми отсчетами с интервалом 1. 
Во-вторых, ВКФ исходных последовательностей числел из 
и 
будет в 
большинстве случаев равняться нулю или не превышать некоторого небольшого 
значения, что не позволит сделать какие-то выводы. Рассмотрим пример, когда 
L
{ } 


80 
Рис. 2.5.5.1 Последовательность 
и соответствующие ее элементам веса 
Для того, чтобы учесть возможность замены некоторых терминов 
синонимами, воспользуемся тем, что связи синонимов имеют близкие значения. 
Для обеспечения этого свойства связей было выдвинуто ребование 2 п. 2.5.4: 
связи близких терминов должны иметь близкое значение. 
Существует два способа учета синонимов: 
1. Заведомо расширить множество 
значениями
синонимов каждого 
слова. В таком случае, если у каждого слова из связи есть n синонимов, то 
для каждой связи прийдется вычислять 
значений 
и хранить их в 
памяти. 
2. При вычислении функции корреляции перебрать значения 
значений 
и выбрать максимальное. 
В первом случае функцию корреляции 
(2.5.5.1) можно вычислить 
только для 
, однако для хранения синонимов потребуется больше памяти. 
Во втором случае памяти потребуется существенно меньше, однако при 
анализе каждого сообщения потребуется совершить существенно больше 
вычислений.
В дальнейшем будет рассматриваться более быстрое решение, на основе 
способа 1. 
0
1
2
3
4
5
6
7
8
9
80
100
120
140
160
180
200
220


81 
Воспользуемся тем, что связи синонимов имеют близкие значения для 
расширения множества 
. В результате, получим следующее множество . 
{ }. 
Необходимо обратить внимание на то, что дополнять синонимами 
необходимо только последовательность 
. Последовательность
в дополнении 
не нуждается. 
Также надо учитывать, что замена синонимом не является полноценной. 
Поэтому будем уменьшать «вес» замены по мере удаления от исходного слова.
Рис. 2.5.5.2 Дополненная последовательность 
и соответствующие ее 
элементам веса 
После формирования множеств 
и 
можно приступать к вычислению 
Предлагается следующий способ вычисления 
1. При разном количестве отсчетов 
и 
увеличиваем длину более короткой 
последовательности, дополняя ее 
нулевыми отсчетами. Как правило, 
это 
2. Далее вычисляется сумма

, (2.5.5.2) 
0
1
2
3
4
5
6
7
8
9
80
100
120
140
160
180
200
220


82 
где 

| после возможного дополнения нулями на шаге 1,
– значение i-
ого элемента последовательности. 
3. Далее вычисляется константа 
(2.5.2.1) для сравнения c 

| (2.5.5.3) 
Вычисление константы 
указанным в (2.5.5.3) способом не всегда 
корректно. Описанный способ подходит для случаев, когда передаваемое 
сообщение содержит только защищаемые данные. Доработка метода для случаев, 
когда передаваемое сообщение содержит не только защищаемые данные является 
одним из направлений для дальнейшего развития метода.
Предложенный метод идентификации защищаемых данных в передаваемых 
сообщениях позволяет обнаружить угрозу утечки информации как при передаче 
защищаемого текста без модификации, так и в случае замены ряда терминов и 
иной формулировки защищаемых данных. Важной особенностью является то, что 
предложенный метод работает быстрее, чем методы основанные на графах 
семантических связей, что позволяет использовать его при работе с большими 
объемами защищаемых данных. 

Download 1,32 Mb.

Do'stlaringiz bilan baham:
1   ...   33   34   35   36   37   38   39   40   ...   47




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish