Alisher navoiy nomidagi toshkent davlat o„zbek tili va adabiyoti universiteti



Download 3,88 Mb.
Pdf ko'rish
bet95/138
Sana25.04.2022
Hajmi3,88 Mb.
#581651
1   ...   91   92   93   94   95   96   97   98   ...   138
Bog'liq
kompyuter lingvistikasi

yozuv, yozuvning, 
yozish, yozmoq 
so‗zlari uchun asos sifatida 
yoz
ni oladi. Lemmatayzer esa 
fe‘l shakllari 
yozish, yozmoq
dan uchun asos deb 
yoz
ni, ot turkumidagi 
yozuv
, yozuvning
so‗zlari uchun asos deb 
yozuv 
leksemasini aniqlaydi. 
Lemma tushunchasi leksemani ifodalaydi. Lemmatizatsiya masalasi esa bir 
leksemaga mos keluvchi so‗z shakllarini aniqlashdan iborat bo‗ladi. 
Lemmatayzer asosida 
daraxtlarimning 
so‗zi analiz qilinganda so‗z asosi 
daraxt,
son qo‗shimchasi 
–lar,
egalik qo‗shimchasi –
im,
kelishik 
qo‗shimchasi:- 
ning 
morfologik ma‘lumotni ifodalaydi. 
Elektron lug‗atlar tuzish jarayonida ma‘lumotlar ombori, matnlar 
korpusini yaratish, qidiruv tizimi, kodlash, lingvistik va dasturiy ta‘minot 
unsurlari qatoridagi bosqich hisoblanadi.
Parsing
leksemalarning (so‗z, tokenlarning) chiziqli ketma-ketligini 
uning formal grammatikasi bilan chog‗ishtirishdir. Natijada tobelik daraxti 
(sintaktik daraxt) yuzaga keladi. Katta hajmli korpuslar uchun avtomatik 
sintakitik analizatorlarning qurilishi kompyuter lingvistikasining muhim 
sohalaridan biri hisoblanadi
1

Masina tahririda, asosan, imloviy xatolarni tekshirish ko‗zda tutiladi 
va asosiy e'tibor so‗zshakllarga qaratiladi. Ushbu maqsadga erishish uchun 
quyidagi ishlar amalga oshirilishi talab qilinadi: 1) tilning lug‗at tarkibini 
komyuterga kiritish, ya'ni elektron lug‗atni tuzish; 2) lug‗atdagi adabiy 
tilga mansub so‗zlarni ajratib olish; 3) ajratib olingan so‗zlarni uslubiy 
(ilmiy, badiiy, publitsistik, rasmiy-idoraviy va so‗zlashuv) jihatdan 
guruhlash; 4) adabiy so‗zlarni turkumlarga ajratish; 5) so‗zlarni turkum 
doirasida guruhlash (masalan, ot turkumidagi so‗zlarni shaxs otlari, 
o‗simlik nom (fitonim)lari, joy nom (toponim)lari kabi guruhlarga 
ajratish); 6) guruhlangan so‗zlarning affikslar kombinatsiyasini tuzish; 
bunda affikslar kombinatsiyasining amalda adabiy til doirasida 
foydalaniladigan hajmi qamrab olinadi. Kombinatsiyalar qatorini tuzishda 
affikslar 
ketma-ketligiga 
e'tibor 
qaratiladi. 
M-n, 
ot 
turkumida 
ko„plik+egalik +kelishik
kategoriyasi va h.k.

Sintaktik tahlil bosqichi – 
matn tahririning eng qiyin bosqichi. Uning 
asosiy vazifasi so‗zlarning o‗rnini va ularning o‗zaro birikishini aniqlash 
1
Захаров В.П., Богданова С.Ю. Корпусная лингвистика.-Иркутск:ИГЛУ,2011.-С.41. 
2
Aбжалова М. Ўзбек тилидаги матнларни таҳрир ва таҳлил қилувчи дастурнинг лингвистик 
модуллари (расмий ва илмий услубдаги матнлар таҳрири дастури учун). Филол. фан...(PhD) 
дисс.-Тошкент, 2019.-Б.15. 


172 
hisoblanadi. Shu bois ushbu bosqichni 
tahrir bosqichi
deb emas, balki 
lingvistik tahlil bosqichi
, deyish mumkin. Bir so‗zshakl bir qancha 
so‗zning grammatik shakliga to‗g‗ri kelishi mumkin. Bunday hollarda 
so‗zlarni farqlash uchun matn kirituvchiga shunday so‗zlar varianti 
ko‗rsatiladi va matn teruvchi so‗zlardan muvofiqini tanlab qo‗yadi. Ushbu 
jarayon morfologik tahrirda ham kuzatiladi. Ya‘ni so‗zning xato yozilgani 
aniqlangach, matn teruvchiga tanlab qo‗yish imkonini beruvchi so‗zlar 
variantini taklif etadi. Sintaktik tahlilda asosiy maqsad so‗zlarning o‗zaro 
bog‗lanish me‘yorlarini e‘tiborga olishdir.
Matnlarni 
grammatik 
tahrir 
qilishda 
(Grammar 
checking) 
kompyuterga kiritilayotgan matndagi gap strukturasining grammatik 
jihatdan to‗g‗ri tuzilganligi tekshiriladi. Buning uchun dasturga gaplarning 
kombinatsiyalarini kiritish talab etiladi. Shunda dastur gapni kiritilgan 
ko‗plab me‘yoriy kombinatsiyalar doirasida tekshiradi. Agar gap tuzilish 
kombinatsiyalariga muvofiq kelmasa, dastur uni xato deb hisoblaydi va 
foydalanuvchiga bu haqda xabar beradi. Grammar checking dasturida 
faqat grammatik me‘yorlar emas, balki semantika, so‗zlarning ma‘nosi 
hamda mantiqiyligiga ham e‘tibor beriladi. Masalan, 
Qush uchmoqda

Odam uchmoqda. Devor uchmoqda
gaplari Grammatik jihatdan to‗g‗ri 
yozilgan, ya‘ni ega+kesim munosabati mavjud (III shaxs, birlik). Ammo 
semantikasiga e‘tibor bersak, gaplar xato tuzilgan. Chunki odamning 
qanoti yo‗q, faqat badiiy matndagina insonning uchishi haqida yozish 
mumkin. Matnlarni kompyuter vositasida qayta ishlashda ilmiy, rasmiy-
idoraviy, axborot doirasidagi matnlar e‘tiborga olinadi
1
. Keltirilgan 
devor 
uchmoqda
gapining semantikasi esa noto‗g‗ri va gap hech bir uslubga mos 
kelmaydi. Chunki devor muqim bir joyda turuvchi, binoning, uyning 
tomini ko‗tarib turuvchi yoki xonalarga ajratuvchi tik ko‗tarilgan qismi 
2
.
Matnlarni semantik tahlil qilish bosqichida tushunchaga ega so‗zning 
o‗rinli qo‗llanilayotgani tekshirib boriladi. Buning uchun dastur 
ta‘minotiga tezaurus lug‗atlarni kiritish talab qilinadi. Tezaurus lug‗atning 
o‗ziga xos maxsus ko‗rinishi bo‗lib, unda lug‗aviy birliklar o‗rtasida 
semantik munosabat (sinonimlar, antonimlar, paronimlar, giponimlar, 
giperonimlar va boshqalar) ko‗rsatilgan bo‗ladi.
Zamonaviy texnologiyalarning kundalik turmushda muhim o‗rin 
egallashi, ilm-fanning rivojlanishi avtomatik tahrir va tahlilning 
1
Абжалова М.А.
Ўзбек тилидаги матнларни автоматик таҳрирлашда услуб масаласи// 
Таълим тизимидаги ижтимоий-гуманитар фанлар, №2, Т.: 2013, 141-145-бетлар; 
L. 
Abduhamidova .
Kompyuter lingvistikasining avtomatik tahrir yo‗nalishi. BMI.-T.,2016. 33-36
2
Қаранг: Ўзбек тилининг изоҳли луғати. 1-жилд. Т., 2006., 588-б.


173 
ahamiyatini oshirmoqda. Avtomatik tahrir faqat matnlardagi mexanik 
xatolarni bartaraf etibgina qolmay, matnning savodli yozilishini ham 
ta‘minlaydi, matn kirituvchiga jumlada xato so‗z borligi haqida xabar 
berib, xatoni bartaraf etishga undaydi, natijada to‗liq lingvistik me‘yorlar 
darajasidagi matnni yuzaga keltirishda vaqt tejaladi.
So‗zni turkumlarga bo‗lishda ikki umumiy super kategoriya mavjud: 
yopiq sinf va ochiq sinf. Yopiq sinflar boshqa a‘zolar bilan aloqa 
o‗rnatgan. Masalan, predloglar yopiq sinf hisoblanadi, chunki ana shu 
aloqalar natijasida o‗rnatilgan, yangi predloglar kamdan-kam hollarda 
hosil bo‗ladi. Bundan farqli ravishda, otlar va fe‘llar ochiq sinf 
hisonlanadi, chunki yangi otlar va fe‘llar davomiy tarzda paydo bo‗lib 
boradi yoki boshqa tillardan o‗zlashtiriladi.
Dunyo tillarida to‗rtta katta ochiq guruh mavjud: otlar, fe‘llar, sifatlar 
va ravishlar.
So‗zlarni turkumlarga ajratish algoritmi so‗zlarni bir tizimga tizilishi 
va ma‘lum bir tartibda belgilanishidir. Ingliz tilida so‗zlarni turkumlarga 
ajratishda Brown korpusi (1979) dastlabki asosiy ajratish namunasi bo‗lib, 
turli janrlarda yozilgan 500 dan ortiq matndan 1 million ta so‗zlar 
to‗plamini o‗z ichiga oladi. Bu korpus birinchi turkumlarga ajratishda 
dastlabki tadqiqotlardan biri hisoblanadi. Unda 87 ta ajratilgan to‗plam 
berilgan. Keyinchalik 45 ta ajratilgan to‗plamga ega Penn Treebank 
korpusi (Marcus, 1993), Britaniya Milliy Korpusi (British National 
Corpus, 1997) kabi so‗z turkumlariga ajratishdagi to‗plamlar berilgan.
Ba‘zi turkumlarga ajratishdagi farqlar inson uchun ham, mashina 
uchun ham murakkabdir. Masalan, predloglar, yordamchi so‗zlar, ravishlar 
katta o‗xshashlikka ega. Masalan, 
around
so‗zi yuqorida sanalgan uchta 
vazifada ham kelishi mumkin: 
1.
Mrs. Shafaer never got 

Download 3,88 Mb.

Do'stlaringiz bilan baham:
1   ...   91   92   93   94   95   96   97   98   ...   138




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish