корпуса, основанную на теориях (взглядах) на синтаксис в узбекской
лингвистике.
Важно
изучить,
обобщить,
сравнить
весь
созданный
теоретический материал по синтаксису и выбрать правильный подход при
создании синтаксических тегов. Каждый исследователь может поддержать
определенную точку зрения на языковое моделирование по объективным /
субъективным
причинам:
из-за
структуры
языка теория
языковой
формализации может не применяться к другому языку, если она применяется
к одному языку63.
Как упоминалось ранее, исходя из концепции
минимизации, имеет смысл включать в систему тегов только необходимую
информацию.
Основы
узбекской
формальной
грамматической
интерпретации
получили
широкое
распространение благодаря
работам
А.Гуломова,
М.Аскаровой, Г.Абдурахманова64. К 70-м годам прошлого века узбекская
синтаксическая
теория
и
интерпретация
синтаксической
структуры
узбекского языка, основанная на методе формального анализа, была
полностью
сформирована,
обобщена
в
научной
грамматике65,
опубликованной в 1976 году. По результатам формального синтаксического
описания необходимо перечислить исследования семантического синтаксиса
и валентности, проведенные на синтаксисе узбекского языка и основанные на
методах
системно-структурного
анализа.
Обобщая
теории
этих
исследований, можно выделить следующие теоретические основы для
дифференциации синтаксических единиц:
1) хотя лемма, слово, фраза и словосочетание различаются как простые
формы поиска в корпусе, поиск на основе морфологических символов ведет в
аннотированных корпусах. Поскольку поиск, основанный на синтаксических
и семантических символах, является относительно сложным процессом,
невозможно синтаксически/семантически пометить все корпуса;
2)
при
разработке
системы
синтаксических
тегов,
наряду
с
современными
инструментами/программами
автоматического
анализа,
можно разработать программу синтаксического разборатора для корпусов
узбекского языка на основе существующих взглядов на синтаксис в
узбекской лингвистике. Важно изучить и обобщить весь теоретический
материал о синтаксических единицах и выбрать правильный подход к
созданию синтаксических тегов;
3) существуют разные подходы к синтаксическим единицам, поэтому
определение системы синтаксических единиц узбекского языка также
является ключевой задачей при выявлении единицы корпуса;
4) должен быть разработан специальный алгоритм, фильтр, для
обнаружения соединений, которые невозможно различить по внешним
Do'stlaringiz bilan baham: