Kompyuter lingvistikasi: muammolar, yechim, istiqbollar


Alisher Navoiy nomidagi Toshkent



Download 0,77 Mb.
Pdf ko'rish
bet6/7
Sana11.02.2023
Hajmi0,77 Mb.
#910295
1   2   3   4   5   6   7
Bog'liq
elov-b.b.-amirqulov-m.a.-ozbek-ingliz-tillari-parallel-korpusini-yaratish-tamoyillari

Alisher Navoiy nomidagi Toshkent 
davlat o‘zbek tili va adabiyoti 
universiteti 
“KOMPYUTER LINGVISTIKASI: 
MUAMMOLAR, YECHIM, ISTIQBOLLAR”
Xalqaro ilmiy-amaliy konferensiya 
Vol. 1 
 
№. 01 (2022)
 
http://compling.navoiy-uni.uz/
 
111 
1.Manbalarni jamlash.
Dastlab original tildagi matnlar hamda ularning tarjimalari jamlanadi. Turli 
tip(mas.,doc, pdf, rtf)dagi matnlar oddiy matn tipiga o‘giriladi. 
2.Formatlash.
Formatlash jarayonida matnlar UTF-8(Unicode) shaklida kodlanadi hamda XML 
Corpus Encoding Standart(XCES)dan foydalanib izohlanadi. 
3.Matnlarni gaplarga ajratish.
Kodlangan matnlar turli dasturlar orqali gaplarga ajratiladi. Buning uchun Lf 
Aligner, Twente-Aligner kabi dasturlardan foydalanish mumkin hamda ularni 
internet tarmog‘ida ochiq kodli shaklda topishimiz mumkin. 
4.Tokenizatsiya.
Tokenizatsiya jarayonida so‘zlar alohida olinadi va tinish belgilaridan tozalanadi. 
5.Lingvistik izohlash. 
Ushbu jarayonda tokenlarga ajratilgan so‘zlar morfologik teglanadi. Korpus sifatini 
yanada oshirish uchun sintaktik analiz ham amalga oshirilishi mumkin. 
6.Natija. 
Yuqoridagi jarayonlardan o‘tgan matnlar foydalanuvchi so‘roviga ko‘ra aks 
ettiriladi. 
XULOSA. 
Xulosa o‘rnida aytish mumkinki, parallel korpuslar nafaqat 
tillarni o‘qitish sohasida, balki mashina tarjimasi uchun ham dasturulamal bo‘lib 
xizmat qiladi. Biroq sifatli tizimga erishish dasturchi hamda lingvistlardan yuqori 
darajadagi saviya va mehnatni talab etadi. O‘zbek va ingliz tillari korpusi haqida gap 
borar ekan, ularning turli til oilalariga mansubligi, o‘zaro tarjima manbalarining 
tanqisligi esa parallel korpus yaratish jarayonini yana bir qadar qiyinlashtiradi. 
Shunga qaramay, mavjud manbalar asosidagi o‘zbek-ingliz tillari korpusini yaratish 
yuqori natija sari ilk qadam bo‘lib xizmat qiladi. Jahon tajribasida ham kuzatishimiz 
mumkinki, dastlabki korpuslar kichik hajmdagi, asosan ilmiy, rasmiy uslubdagi 
matnlardan tarkib topgan. Yillar davomida soha rivojlangan hamda korpuslarning 



Download 0,77 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish