42
Аннотация
. Ушбу мақолада семантик анализаторнинг лингвистик асоси бўлиб хизмат
қиладиган омоним сўзлар ва уларнинг корпусда берилиши масласи борасида фикр юритилган.
Омоним сўзлар туркум нуқтаи назардан гуруҳланган. От ва феъл ҳамда сифат ва феъл туркуми
доирасида учрайдиган омоним сўзларнинг фильтрини ишлаб чиқиш ва унинг аҳамияти ёритилган.
Калит сўзлар
: омоним, омонимияни бартараф этиш, бир сўз туркуми доирасидаги омоним
сўзлар, от ва феъл ҳамда сифат ва феъл туркуми доирасида учрайдиган омоним сўзлар, турли
туркум доирасида вужудга келадиган омоним сўзлар, фильтр, семантик фильтр, морфологик
фильтр.
Annotation
. The article deals with homonymous words, which serve as the linguistic basis of the
semantic analyzer, and the issue of their representation in the corpus. Homonymic words are grouped in
terms of the plural. Developed and highlighted the development and importance of the filter of
homonymic words that are found inside nouns and verbs, as well as adjectives and verbs.
Keywords
: homonym, elimination of homonymy, homonymous words in one group of words,
homonymous words that occur within a noun and a verb, as well as an adjective and a group of verbs,
homonymous words that occur in different categories, filter, semantic filter, morphological filter.
Омонимликни бартараф этиш борасида Миллий корпуслари яратилган тилларда амалга
оширилган ишлар ҳамда уларнинг амалий натижасини ўрганиш муҳим босқич ҳисобланади.
Бундай тилларда “снятие омонимии” (омонимияни бартараф этиш) муаммоси таҳлил қилинган.
Масалан, Россия компьютер лингвистикасининг жадал ривожланиб бориши туфайли корпус
ишланмалари натижалари халқларнинг миллий тилларига татбиқ этила бошланди. Қалмоқ
тилининг Миллий корпуси [http://kalmcorpora.ru/]ни яратиш ғояси (ҚТМК) 2010 йил охирида
КИГИ РАС ходимлари томонидан илгари сурилиб, ўз фаолиятини бошлади. Институт “Хальмг
үнн” газетаси редакцияси ва “Герел” нашриётига уларнинг биринчи дастурий таъминотининг
корпусига асос бўлган электрон архивлар, яъни морфологик изоҳсиз Қалмоқ тилидаги матнлар
тўпламини тақдим этишни сўради. Ҳозирги кунда корпус 17 млнга яқин токенларни ўз ичига
олади. Графематик, морфологик ва семантик таҳлилни автоматик равишда бажарадиган дастур ва
корпус менежери (ахборотни қидириш ва сақлаш, маълумотларни қайта ишлаш ва натижаларни
кўрсатувчи тизим) яратилди. Буларнинг барчаси қисқа вақт ичида амалга оширилди (тахминан
тўрт йил ичида). Корпуснинг ривожланиш истиқболлари нафақат қалмоқ тилининг янги субкорпус
ва аннотацияларнинг янги турларини яратиш, балки омонимияни бартараф этиш сифатни
сезиларли даражада яхшилайдиган ахборот ресурсини яратишга йўл очди.
Шуни таъкидлаш керакки, қалмоқ тилидаги омонимлар нафақат ўхшаш товушга, балки бир
хил имлога эга бўлиб, улар талаффузида фарқ қилиши мумкин. В.И.Рассадин ва
С.М.Трофимовларнинг таъкидлашича, қалмиқ тилининг ёзма ва оғзаки шакллари бутунлай
бошқача бўлиб, унинг асосида фонематик тамойилнинг йўқлиги муайян муаммоларни келтириб
чиқарди. Бунга сабаб редукцион белгиларнинг, ёки “ноаниқ унлилар”нинг алифбо белгилар
таркибидан бутунлай чиқариб ташланганлигидадир [Биткеев, 1975].
1950-йиллар охирида К.Е.Harper, А.Сaplan асарларида омонимияни олиб ташлашнинг
асосий усули сифатида сўзнинг муайян маъноси амалга ошириладиган контекстуал шароитларни
ўрганиш ва тавсифлаш ҳақида айтиб ўтилган. Бу ўринда контекст атамаси остида ўша сўз ўзи
билан бирга ишлатиладиган сўзларнинг муҳити сифатида тушунилади.
Ўрганилаётган муаммо учун минимал ҳал қилувчи контекст масаласи ҳам ўринлидир. Шу
муносабат билан А.Caplan томонидан контекстини минимал бартараф этишни ўрганиш бўйича
42
*
ТошДЎТАУ докторанти (DSc), филология фанлари бўйича фалсафа доктори (PhD)
Do'stlaringiz bilan baham: |