Основные таблицы базы данных:
1. Словарь узбекского языка (таблица MorfDictionary);
2. Наборы окончаний с правилами изменения основы слова (таблица Endings);
3. Имена и описатели классов слов узбекского языка (таблица Words);
4. Типы слов (таблица Wordtipe);
5. Типы окончаний (таблица Endstypes);
6. Пользователи (таблица Users);
7. База знаний. (таблица Rules);
MorfDictionary
|
i d
|
word
|
EndingsID
|
С lassID
| Endings
|
I D
|
ending
|
t ipeID
|
description
|
Endstypes
|
ID
|
Tipe
|
Description
|
Words
|
I D
|
Name
|
Description
|
PartOfSpeech
|
W ordtipeID
|
Rules
|
ID
|
Rule
|
Description
|
EndingsID
|
WordsID
|
Users
|
ID
|
login
|
password
|
expert
|
Wordtipe
|
ID
|
Tipe
|
Description
|
Рис. 3.1. Блок-схема структуры базы данных.
MorfDictionary – Таблица для хранения базы слов и окончаний для ускорения вывода результата. Таблица хранит слова заполненные экспертами.
Words – Список основ в которой имеются поля: Name – основа, описание основы, partofspeech – фонетическое описание, тип основы.
Rules – База знаний. Правила для морфологического анализа.
4. Интеллектуальный морфологический анализатор
Для формализации правил добавления суффиксов и окончаний предлагается использовать семантическую нейронную сеть. С помощью такой сети генерируются словоформы узбекского языка, и порождается структура словаря начальных форм в виде синхронизированного линейного дерева. Для представления словоформы и ее признаков используются следующие метасимволы:
#-разделитель между словами,
(-начало слова,
)-конец слова,
!-начало признака словоформы (падеж и т.д.),
*-конец признака словоформы.
пример слова «бола -ребенок»(основа слова) и двух его словоформ «болам -мой ребенок», «боланг -твой ребенок» (в узбекском языке одушевленные существительные изменяются по лицам с помощью личных окончаний). Рецептор возбуждается на символ начала слова «(». Далее переходит в состояние «б», при подаче символа «б», далее последовательно «(бо», «(бол», «(бола», и затем одновременно два субсостояния «(болам)» и «(боланг)» структура связей леммы определяет следующие признаки: имя существительное, одушевленное, притяжательное окончание первого лица), притяжательное окончание. При подаче на лемму слова «(болам)» она переходит в возбужденные субсостояния: «(болам)», «!зе*», «!жа*», «!11*» а при подаче слова «баланг» в возбужденные субсостояния: «(баланг)», «!зе*», «!жа*», «!22*».
Нейроны распознают отдельные символы входной символьной последовательности. На выходе генерируется сигнал, означающий наличие или отсутствие соответствующего символа в анализируемом тексте. Нейроны выдают результат распознавания отдельных фрагментов входной символьной последовательности. Для обозначения таких фрагментов во входной символьной последовательности применяются метасимволы скобок: "(" и ")". Тогда приведенный пример перепишется в виде: ((бола)м), ((бола)нг), (((бола)м)нинг), (((бола)нг)да) [9].
Do'stlaringiz bilan baham: |