361
A.V.Dibo, A.V.Sheymovich qadimgi turkiy tillar va xakas tili morfologik analizatorini
yaratishda dastlab grammatik kategoriyalar tavsifini oʻrganishadi. Oltoy tillarini tavsiflashda
qabul qilingan an’anaga koʻra, xakas tilida quyidagi asosiy grammatik sinflar ajrataladi: nomlar,
fe’llar. Guruhdagi dastlabki ikki sinf ma’lum rasmiy koʻrsatkich (affiks)lar bilan ifodalangan
grammatik toifalar toʻplami bilan tavsiflanadi. Grammemalar toʻplami soʻzni soʻzga tobelantirib
bogʻlash hamda sintaktik shakl yasovchilar paradigmasini ajratadi. Masalan, fe’l uchun shaxs,
son, mayl, zamon, ot uchun son, egalik, kelishik. Ma’lumki, turkiy
tillarda grammatik sinflar
orasidagi differensiatsiyaning ifodalanishi kuchsiz. Xususan, ismlar orasida bu xususiyat keng
tarqalgan: gapdagi vazifasiga qarab bir soʻz ham ot, ham sifat sifatida qaralish holatlari
kuzatiladi [Dibo;11; 20-26].
Shuningdek, morfologik analizator tuzishda soʻz asoslari lugʻati ham muhim lingvistik
ta’minot vazifasini oʻtaydi. Xakas tili morfologik analizatorini tuzishda lemmalarni guruhlashda
yuqorida tahlil qilingan masala alohida e’tiborga olingan. Turkiy tillar morfologik tahlil tizimi
hamda ularning modellari tavsifi, tahliliga bagʻishlangan bir qancha tadqiqotlar [Oflazer; 4]
mavjud. Quyida ularning ayrimlari bilan tanishamiz.
A.V.Dibo, A.V.Sheymovichning turkiy tillar avtomatik morfologik
analizi borasidagi
fikrlari ahamiyatga molik [Dibo; 11; 20-26]. Maqolada turkiy tillar uchun avtomatik morfologik
analizatorning ishlash tamoyillari tavsiflangan. Uning asosiy tarkibiy qismi sifatida quyidagilar
ajratiladi:
1)
tilning grammatik lugʻati;
2)
soʻz shaklining tartibli modeli (soʻzshakl pozitsiyalar toʻplami va bu pozitsiyalar
uchun qoʻshimchalarning morfologik ifodalari);
3)
soʻzshakli chegarasida qoʻshimchaning muvofiqlik qoidalari hamda ma’lum bir
qoʻshimchaning allomorflarini tanlash uchun ikki darajali fonetik qoidalar.
Parserning ishlash algoritmi F.Krilov tomonidan StarLing tizimi bazasi asosida ishlab
chiqilgan qoidalar tizimiga boʻysunadi. Namuna sifatida qadimgi turk tili morfologik analizatori
versiyasi keltiriladi. Turkiy tillar uchun moʻljallangan analizator rus yoki nemis tillari kabi hind-
evropa tillariga moʻljallangan Abbyy Finereader, Abbyy Lingvo kabi yirik dasturiy
mahsulotlarda ishlatiladigan avtomatik morfologik analizatorlar bilan
bir xil tamoyil asosida
ishlab chiqiladi. Lugʻatdagi har bir lemma paradigma indeksi shaklini oladi. Flektiv tilda
paradigmalar katta emas, ammo ularning soni koʻp. Analizator har bir soʻz uchun toʻliq
paradigmani shakllantiradi, keyin matnda uchragan soʻzshaklni shu paradigma bilan qiyoslaydi.
A.V.Dibo, A.V.Sheymovichlar oltoy guruhiga kiruvchi turkiy tillar morfologik analizatori
xususiyatini yoritar ekan, ushbu metod barcha agglyutinativ tillar uchun optimal usul emasligiga
urgʻu beradi.
A.V.Dibo, A.V.Sheymovich agglyutinativ tillarning xususiyatlarini
quyidagicha
farqlashadi [Dibo; 11; 20-26]:
1) sintaktik shakl yasovchi qoʻshimchalar tizimi keng rivojlangan;
bunday
qoʻshimchalarning koʻpchilik qismi grammatik jihatdan bir ma’noli, ya’ni qoʻshimchaning oʻzi
grammatik omonimiyani hosil qilmaydi (bir grammatik shakl bitta grammatik ma’noni
ifodalaydi;
2) turlanish, tuslanishning yagona usuli mavjudligi, ya’ni (flektiv tillarga qaraganda) ism
va fe’llar orasida turlanish hamda tuslanish tizimida farq katta emas;
3) murakkab morfonologik hodisalar mavjud emas: allomorflar qoʻllanishining aniq
qoidalari mavjud.
Agglyutinativ soʻzshakllar asosga standart grammatik shakllarning qat’iy tartibda
qoʻshilishidan hosil boʻladi: morfemaning chegarasi aniq, morfemalar qoʻshilishidan hosil
boʻladigan fonetik hodisalar qoidasi qat’iy. Ma’lum bir soʻzshaklning
paradigmasini tuzish
soʻzshaklning favqulodda murakkab, koʻptarmoqli ekanligini koʻrsatadi. Bu murakkablik
sintaktik shakl yasovchi shakllarning koʻpligi bilan izohlanadi. Bu esa turkiy tillar morfologik
362
analizatorini tuzishda morfemalar kombinatsiyasining ahamiyatni katta ekanligidan dalolat
beradi. Turkiy tillarning mavjud parserlari bitta soʻzshaklning 300gacha shaklnini qamrab olgan
paradigmasini tuzgan holatlarni koʻrish mumkin. Bu esa analizatorning ish sifatiga ta’sir
koʻrsatmay qolmaydi.
Turkiy soʻzshakllarning kompyuter modelini tuzishda agglyutinativ tillarga xos an’anaviy
“tasniflangan grammatika”ga asoslaniladi. Bu dasturiy ta’minot axborot vositasi agglyutinativ
tillarni
tavsiflashning qulay vositasi, uning morfologiyasi quyidagi talablarga javob berishi
kerak:
a) soʻz yasovchi qoʻshimchalar ketma-ketligining belgilab qoʻyilishi;
b) soʻz yasovchilarning grammatik bir ma’noliligiga erishish;
v) ma’lum bir grammemaning bir soʻzshaklda qanday shaklda uchrashining belgilanganligi
[Dibo; 11; 20-26].
Morfologik analizatorning asosiy tashkil qiluvchilari sifatida quyidagilarni koʻrsatish
mumkin:
1) til lugʻati (soʻzning turkumga mansublik belgisi haqidagi izoh hamda fonologik qoidalar
mavjud lugʻat);
2) soʻzshaklining etarli grammatik tavsifiga asoslangan (tilning avtomatik tahliliga
yoʻnaltirilgan) kompyuter modeli;
3) ma’lum qoʻshimchaning asosga qoʻshilishi uchun fonetik qoidalarga boʻysunuvchi
allomorflarini tanlash qoidalari toʻplami.
F.Krilov tomonidan tahlil algoritmi yuqorida sanab oʻtilgan material bilan istalgan turkiy
til materialini toʻldirish hamda undan foydalanish imkonini beradi. U tuzgan algoritm boʻyicha
soʻzshakl tahlili oʻngdan chapga yoʻnaltiriladi. Dastlab, dastur asoslar lugʻatidan soʻzshaklning
toʻliq shaklini qidiradi. Agar asoslar lugʻatida bunday shakl (belgilar ketma-ketligi) uchramasa,
parser soʻzshaklning oʻng tomonidagi qoʻshimcha formantiga mos shaklni izlaydi. Agar bazada
mavjud qoʻshimchaga mos belgilar ketma-ketligi topilsa,
kesib olinib, tekshirishga yuboriladi;
soʻzshaklning chap tomoni asoslar lugʻat bilan solishtiriladi. Agar natija musbat boʻlsa, parser
shu shaklning tahlilini boshlaydi. Natija manfiy boʻlganda, parser yana oʻng tomondagi shaklga
murojaat qiladi hamda qoʻshimchalar bazasidan mos formantni qidiradi. Bu qidiruv asoslar
lugʻatidan mos asos topilguncha davom etadi. Ushbu parser xakas tili morfologik tahlili uchun
ishlab chiqilgan boʻlsa-da, ma’lumotlar bazasini toʻldirish orqali shor, tuva,
yoqut va qadimgi
turk tilini morfologik tahlil qilish mumkin. Bu tillarning “asoslar lugʻati” SUBD STARLING
vositasida tuzilgan va katta turkiy-rus tili lugʻati bilan tekshirilgan.
Do'stlaringiz bilan baham: