Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“O‘ZBEK MILLIY VA TA’LIMIY
KORPUSLARINI YARATISHNING NAZARIY
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021)
95
RDRPOSTagger va boshqa dasturiy vositalar kiradi. Bu roʻyxatni bundan-da kengaytirish mumkin.
Dasturiy vositalarning juda koʻpchiligi soʻz turkumlari teglangan korpuslarga statistik, ehtimollikka
asoslangan usullarni, mashinali o‘qitish algoritmlarini qo‘llash orqali yaratilgan. Afsuski, oʻzbek tili
uchun matndagi so‘zlarni avtomatik so‘z turkumiga ajratib beruvchi dasturlarni topish mushkul boʻlib
qolmoqda. Ommaga ochiq taqdim qilingan yaxlit dasturiy vosita boʻlmasa-da, bu sohada olib
borilayotgan ilmiy tadqiqotlar mavjudligi juda quvonarli holat. [Simpson, 2009: 55] maqolada REFLEX-
LCTL (Research on English and Foreign Language Exploitation Less Commonly Taught Languages)
loyihasi doirasida 8 ta Osiyo tillari, Yevropa va Afrikaning 5 ta tillari uchun teglash dasturiy vositasi va
til paketi (language pack) loyihalandi. Bu tillar orasida o‘zbek tili ham mavjud boʻlib, 1000 ta so‘zdan
iborat matn ustida tahlil ishlari olib borilgan. Tahlil qilingan matn onlayn mavjud emas. O‘zbek tilidagi
qo‘shimchalarning birinchi elektron lug‘ati [Matlatipov, 2020: 729] tayyorlangan. Elektron lug‘at ot,
sifat, son, fe’l so‘z turkumlariga kombinatorika yondashuvlarini qo‘llab hosil qilingan. O‘zbek tili uchun
korpus yaratish jarayonida yuzaga keladigan nazariy va amaliy masalalar [Tursunov, 2020: 1]da
muhokama etilgan. Korpus tuzishning dastlabki bosqichlari, korpusga qo‘yiladigan talablar keltirilgan va
http://uzbekcorpora.uz da namoyish qilingan. So‘z turkumlarini teglash usullari, teglash jarayonidagi
muammo va yechimlar Axmedovaning [2021: 90] maqolasida tahlil qilingan va o‘zbek tilidagi so‘zlarni
turkumlash uchun qoidaga asoslangan algoritm taqdim etilgan. Chekli avtomatlar va tilshunoslik qoidalari
asosida o‘zbek tilidagi so‘zlarni morfologik tahlil qilish [Matlatipov, 2009: 83, Abdurakhmonova, 2019:
425, Abdurakhmonova, 2019: 1, Bakaev, 2021: 1], stemming algoritmlarini yaratish [Sharipov, 2021: 56]
boʻyicha ham tadqiqotlar mavjud.
Ushbu maqolada o‘zbek tili korpusida soʻz turkumlarini teglash, uning tuzilishi, tarkibi va boshqa
xususiyatlari ko‘rsatilgan. So‘z turkumlarini teglash o‘zbek tili grammatikasiga asosan (UZPOS), Google
unversal soʻz turkumlari ro‘yxatiga ko‘ra [Petrov, 2012: 2089] (UPOS) teglab chiqildi. So‘z turkumlariga
mos teglar ro‘yxati 1-jadvalda keltirilgan.
Do'stlaringiz bilan baham: |