Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti


DEVELOPMENT OF PREFIX CUTTING ALGORITHM TO SOLVE STEMMING PROBLEM



Download 7,21 Mb.
Pdf ko'rish
bet279/398
Sana26.02.2022
Hajmi7,21 Mb.
#467559
1   ...   275   276   277   278   279   280   281   282   ...   398
Bog'liq
Тайёр Миллий корпус тўплам 17.05

 
DEVELOPMENT OF PREFIX CUTTING ALGORITHM TO SOLVE STEMMING PROBLEM 
IN UZBEK LANGUAGE 
Sharipov Maksud Siddiqovich*
85
 
Salayev Ulugbek Ikramovich**
86
 
 
Annotatsiya:
Ushbu maqolada oʻzbek tilidagi soʻzlarning old qo`shimchasini qirqish (stemming) 
masalasi koʻrib chiqilgan. Bu masalani yechishda ikki xil yondashuv taklif qilingan boʻlib, birinchi 
yondashuv boʻyicha old qoʻshimcha bilan boshlangan soʻzlardan old qoʻshimcha olib tashlanadi va 
natija soʻz belgilangan lugʻatdan qidiriladi. Ikkinchi yondashuvga asosan, old qoʻshimcha va shu 
qoʻshimchaga oʻxshash harflar ketma-ketligi bilan boshlanuvchi soʻzlardan lugʻat yaratiladi, hamda 
ikkita toʻplamga ajratiladi. Shular asosida chekli avtomatlar quriladi va algoritmlar ishlab chiqiladi.
Kalit soʻzlar: 
Tabiiy tilni qayta ishlash, chekli avtomatlar, oʻzbek tili, prefiks. 
Annatation:
In this study, it is analyzed the issues of stripping prefix on stemming in Uzbek. As 
proposed approaches, two algorithms were development to remove prefixes at Uzbek words for stemming 
purpose. The algorithms based on finite-state machines. According this, needful lexicon was created to 
use while performing the algorithms. 
 Keywords:
Natural Language Processing, Stemming, Finite State Machines, Uzbek language, 
Prefix. 
Stemmingdan ma’lumotlarni qidirish, mashinali tarjima qilish va matnni umumlashtirish kabi 
masalalarni yechishda samaradorlikni oshirish uchun oldindan ishlov berish bosqichi sifatida 
foydalaniladi. Shu sababli stemming tabiiy tillarni qayta ishlash jarayoni (NLP–Natural Language 
Processing)ning eng muhim masalasidir. Hozirgi kungacha oʻzbek tili uchun stemming masalasini 
yechish boʻyicha yetarli darajada algoritmlar va dasturlar ishlab chiqilmaganligi sababli bu masalani 
oʻrganish va yechish dolzarb hisoblanadi.
Oʻzbek tili asrlar davomida arab, fors-tojik hamda rus tillari bilan oʻzaro aloqada shakllanib kelgan. 
Buning natijasida tilimizga oʻsha tillarga xos boʻlgan yasalmalar va soʻz yasalish qoliplari ham 
oʻzlashgan. Shulardan biri old qoʻshimcha (prefiks) yordamida yasaladigan soʻzlar sanaladi. Old 
qoʻshimcha asosida yasalgan soʻzlarga misol sifatida quyidagilarni keltirishimiz mumkin:
ba–
: batafsil, badavlat, bahaybat;
be–
: bexavotir, begʻubor, befarosat;
no–
: noumid, noqulay, norozi; 
ser–
: serzavq, sergap, serhosil.
Shuningdek, oʻzbek tilida kam hollarda qoʻllanuvchi 
badfe’l, badjahl, badnafs, xushxabar, xushroʻy, 
xushvaqt, hamfikr, hamshahar, hamsuhbat 
kabi soʻz yasalish holatlari ham mavjud. 
ba–

ser–
qoʻshimchalari, asosan, otga qoʻshilib, asosdan anglashilgan belgi-xususiyatning me’yordan 
ortiq, koʻp ekanligini bildirsa
be–,
no–
qoʻshimchalari uning aksini, ya’ni asosdan anglashilgan belgi-
xususiyatga ega emasligini anglatadi. Solishtirish uchun
baquvvat, serma’no, behayo, nooʻrin
. Mazkur 
qoʻshimchalar
–li

–dor

–siz
qoʻshimchalari bilan sinonimik munosabatda boʻla oladi. 
Masalan: 
badavlat
— 
davlatli

beqiyos
— 
qiyossiz

nooʻrin 
— 
oʻrinsiz

sertashvish 
— 
tashvishli 
[Madvaliyev A. 2012]. 
*
85
Urganch davlat universiteti Axborot texnologiyalari kafedrasi dotsenti, maqsbek72@gmail.com 
*
86
Urganch davlat universiteti tayanch doktoranti



Download 7,21 Mb.

Do'stlaringiz bilan baham:
1   ...   275   276   277   278   279   280   281   282   ...   398




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish