Методы повышения показателей качества фильтрации dlp-систем на основе предметно-ориентированной морфологической модели естественного языка


Существующие системы семантического поиска



Download 1,32 Mb.
Pdf ko'rish
bet8/47
Sana22.02.2022
Hajmi1,32 Mb.
#102152
1   ...   4   5   6   7   8   9   10   11   ...   47
Bog'liq
Диссертация

Существующие системы семантического поиска 
В трудах Гавриловой Т.А., Хорошевского В.Ф. [50], [51] исследуется вопрос 
о применении онтологического подхода для информационного поиска. Онтологии 
являются методами представления и обработки знаний и запросов, и 
предназначены для описания семантики данных для некоторой предметной 
области и решения проблемы несовместимости и противоречивости понятий. 
Онтологии обладают собственными средствами обработки (логического 
вывода), соответствующими задачам семантической обработки информации. 
Поэтому онтологии получили широкое распространение в решении проблем 
представления знаний и инженерии знаний, семантической интеграции 
информационных ресурсов, информационного поиска и т.д. 
Определение онтологии дано в работе Gruber T.R «A Translation Approach to 
Portable Ontology Specifications» [52]: эксплицитная, т.е. явная спецификация 
концептуализации, где в качестве концептуализации выступает описание 
множества объектов и связей между ними. 
В работе Wielinga B., Schreiber A.T., Jansweijer [53], сделана попытка дать 
математические определения понятий «модель концептуализации предметной 
области», «база знаний предметной области» и «модель онтологии предметной 
области». 
Онтология определяет общий словарь для ученых, которым нужно совместно 
использовать информацию в предметной области. Она включает машинно-
интерпретируемые формулировки основных понятий предметной области и 
отношения между ними. 
В России информационно-поисковая система с использованием онтологии 
была впервые реализована авторами Добров Б.В., Лукашевич Н.В., Сыромятников 
С.В., Загоруйко Н.Г. в информационно-поисковой системе УИС «РОССИЯ» 
(Университетская 
информационная 
система). 
Поступающие 
на 
вход 


19 
информационной системы потоки документов подвергаются автоматической 
лингвистической обработке, включающей в себя следующие этапы: 
морфологический 
анализ, 
терминологический 
анализ, 
рубрицирование, 
аннотирование [54]. Терминологический анализ реализован на основе Тезауруса 
по общественно-политической тематике. На базе Тезауруса осуществляется 
автоматическое концептуальное индексирование входящего потока текстов и 
производится процедура разрешения многозначных терминов. 
Основная проблема при реализации применении онтологического подхода – 
отсутствие достаточно больших и качественных онтологий предметных областей, 
особенно на русском языке. 
Осипов Г.С. и соавторы предложили собственную модель семантического 
поиска, реализовав ее в информационно-поисковой системе «Exactus», в которой 
объединены 
статистические 
и 
лингвистические 
методы 
поиска. 
Из 
статистических характеристик текста Exactus учитывает TF*IDF веса термов и 
значимость фрагментов текстов (на основе HTML-разметки документов). 
Лингвистическая 
составляющая 

значения 
синтаксем 
(минимальных 
семантикосинтаксических единиц текста) и их сочетаемость в конкретном 
предложении [55]. 
В теории коммуникативной грамматики [56] русского языка опровергается 
традиционное противопоставление синтаксиса семантике, которое предполагает 
Download 1,32 Mb.

Do'stlaringiz bilan baham:
1   ...   4   5   6   7   8   9   10   11   ...   47




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish