Urganch davlat universiteti Fizika-matematika fakulteti 5A120106 – “Kompyuter lingvistikasi” mutaxassisligi magistranti Sobirov Jasurbek Muxtor oʻgʻlining “Oʻzbek tili uchun teglangan korpus yaratish” mavzusidagi magistrlik dissertatsiyasiga
TAQRIZ
Hozirgi kunda tabiiy tilni qayta ishlash (NLP) sohasi jadal rivojlanmoqda va ilmiy, iqtisodiy va madaniy sohalardagi muammolarni hal qilishda muhim rol o'ynamoqda. NLP shuningdek, biznes ma’lumotlarini tahlil qilish, veb-ilovalarni ishlab chiqish, korpus lingvistikasi, kompyuter fanlari, shuningdek sun’iy intellekt kabi sohalarni qamrab oladi. Internetda mavjud bo'lgan ma’lumotlarning aksariyati matnlidir, shuning uchun matnli ma’lumotlarni tahlil qilish, turli xil usullar, masalan, bunday matnlarni morfologik va sintaktik tahlil qilish orqali kerakli ma’lumotlarni olish NLPning asosiy qiziqish sohasiga aylanmoqda.
Bugungi kunga kelib, eng koʻp soʻzlashuvchi tillarning koʻplab til korpuslari mavjud boʻlib, ba’zi eng dastlabki asarlar va mashhurlari - Brown korpusi, Xalqaro ingliz korpusi va Britaniya milliy korpusi hisoblanadi. Hozirgi vaqtda korpus lingvistikasi sohasida turli maqsadlarda til korpusini yaratish bo‘yicha amaliy tadqiqotlar olib borilmoqda. Korporaning lingvistik tadqiqot ishlari uchun foydaliligi ushbu korpuslarda tagli kichik korpuslarni yaratish bilan ta’minlanadi.
Mazkur dissertatsiya ishida ko‘plab yaratilgan teglangan korpuslar o‘rganilgan. Magistrlik dissertatsiyasi kirish, uchta bob va adabiyotlar ro‘yxatidan iborat. Dissertatsiyaning kirish qismida teglangan korpus yaratilishining qisqacha tarixi keltirilgan hamda dissertatsiya mavzusining dolzarbligi asoslangan.
Birinchi bobda teglangan korpus, xususan zamonaviy teglangan korpus va uning turlari haqida fikr yuritilgan. Undan tashqari, oʻzbek tili uchun teglangan korpus yaratish va uning dolzarbligi haqida toʻxtalib oʻtilgan.
Ikkinchi bobda korpuslarni teglash usullari, shu jumladan morfologik hamda sintaktik teglash haqida gap boradi. Soʻzlar oʻzbek tilida qanday tahlil qilinadi, qanday teg turlari mavjud, ular matnda qanday qoʻllaniladi kabi savollarga ikkinchi bobda javob olish mumkin.
Uchinchi bobda teglangan korpusning tarkibiy tuzilishi hamda maxsus belgilar (teglar) qoʻyilgan matnning statistik tahlil koʻrib chiqilgan.
Ushbu magistrlik dissertatsiyasida kompyuter lingvistikasinining muhim qismi hisoblangan korpus lingvistikasi, xususan teglangan korpus yaratish tamoyillari koʻrib chiqilgan.
Sobirov Jasurbek Muxtor oʻgʻlining magistrlik dissertatsiyasi O‘zbеkistоn Rеspublikasi Оliy va o‘rta maхsus ta’lim vazirligi tоmоnidan magistrlik dissertatsiyalariga qo‘yilgan barcha talablarni qanоatlantiradi.
Sobirov Jasurbek Muxtor oʻgʻlining “Oʻzbek tili uchun teglangan korpus yaratish” mavzusidagi magistrlik dissertatsiyasini Davlat attestatsiya komissiyasi oldida himoya qilishga tavsiya qilaman va muvaffaqiyatli himoyadan keyin muallifni 5A120106 – “Kompyuter lingvistikasi” mutaxassisligi bo‘yicha magistr akademik darajasiga loyiq deb hisoblayman.
Taqrizchi: t.f.n. Matlatipov Gʻ. R
Do'stlaringiz bilan baham: |