Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“KOMPYUTER LINGVISTIKASI:
MUAMMOLAR, YECHIM, ISTIQBOLLAR”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2022)
http://compling.navoiy-uni.uz/
108
Korpusning sifatli bo‘lishi undagi ma’lumotlarning miqdoriga bog‘liq.
Chunki hozirda ko‘plab dasturlar statistik ma’lumotlar asosida ishlagani bois,
korpusning ham ulkan ma’lumotlar omboriga ega bo‘lishi uning foydalilik darajasini
oshiradi. Har qanday parallel korpus ikki tildagi jumlalarni, gaplarni hamda so‘zlarni
bir-biriga moslashtirish asosida quriladi. Jumla va gaplarni bir-biriga moslashtirish
avtomatik ravishda kompyuter dasturlari orqali amalga oshirilishi mumkin bo‘lib,
bunday dasturlarning bir nechtasidan bepul foydalanish mumkin va ushbu
dasturlarni ochiq kodli holda internet tarmog‘idan topishimiz mumkin. LF Aligner,
Twente-Aligner yuqoridagi dasturlar sirasiga kiradi va ular matnlarni gaplar
kesimida o‘zaro moslashtiradi:
2-rasm.
LF Aligner dasturi yordamida ingliz va vengr tilidagi matnlar tarkibidagi
gaplarni o‘zaro moslashtirish.
2-rasmda LF Aligner dasturi yordamida ingliz hamda vengr tilidagi
matnlarning gaplarini bir-biriga moslashtirilgan bo‘lib, ushbu jarayon gaplarni
Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“KOMPYUTER LINGVISTIKASI:
MUAMMOLAR, YECHIM, ISTIQBOLLAR”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2022)
http://compling.navoiy-uni.uz/
109
qo‘lda moslashtirishga nisbatan ancha ko‘p vaqtni tejaydi va natijada ish
samaradorligini oshiradi. Yuqori sifatga erishish uchun esa ushbu gaplarning aynan
o‘zaro mosligi mutaxassis tomonidan tekshirib chiqiladi. So‘zlar kesimida
moslashishni amalga oshirish borasida esa hali ko‘plab tatqiqotlar amalga oshirilishi
kerak
[6]
. Chunki bunday jarayonni amalga oshiruvchi dasturlarning aksariyati yopiq
kodli yoki pullik bo‘lib, ko‘plab foydalanuvchilar ushbu dasturlar katta hajmdagi
korpuslar uchun mos tushmasligini ta’kidlashgan. So‘zlarni o‘zaro moslash usulini
2 xil yo‘l bilan amalga oshirish mumkin:
•
manba tilida berilgan ma’lum bir gapdagi so‘zlar o‘sha gapning tarjima
tilidagi so‘zlarga moslashtiriladi. Bu shuni anglatadiki, gapdagi har bir
so‘zga mos alohida so‘z bog‘lanadi.
•
har bir so‘zga mos so‘zlar tarjimasi umumiy bazadan moslanadi. Bu
jarayon yuqoridagisidan ehtimoliy tarjimalar sonining ko‘p bo‘lishi
bilan harakterlanadi.
Parallel korpuslarni yaratish bo‘yicha qilingan ko‘plab izlanishlar, yozilgan
maqolalardan kelib chiqib aytish mumkinki, ushbu korpuslarni tuzishda faqatgina
avtomatik jarayonlarni qo‘llagan holda kutilgan natijaga erishib bo‘lmaydi. Inson
faktori korpus sifatini yaxshilashda salmoqli o‘rin tutganligi bois, bir necha
bosqichlar uning tekshiruvidan o‘tadi. Ba’zi tillar juftligida ikki tildagi tarjima
materiallarining yetarli miqdorda ekanligi parallel korpuslarnig yaratilishini
osonlashtiradi hamda ulkan miqdordagi ushbu tarjimalar nafaqat korpusning sifatini
oshiradi, balki mashina tarjimasi uchun ham ishinchli manba bo‘lib xizmat qiladi.
Biroq, o‘zbek-ingliz tili juftligidagi tarjimalarning soni cheklangan bo‘lib, ushbu
tillar juftligidagi parallel tizimni yaratish ko‘plab matnlar va ularning muqobil
tarjimasini talab qiladi. Ingliz tilidan to‘g‘ridan-to‘g‘ri o‘zbek tiliga yoki o‘zbek
tilidan ingliz tiliga qilingan tarjimalar soni so‘nggi yillarda oshib bormoqda.
Xususan, Cho‘lponning “Kecha va Kunduz”, Abdulla Qodiriyning “O‘tkan kunlar”
Do'stlaringiz bilan baham: |