Mashina tarjimasi


yildan hozirgi kungacha Korpus asosidagi MT tadqiqotlari



Download 0,57 Mb.
Pdf ko'rish
bet9/13
Sana21.05.2022
Hajmi0,57 Mb.
#606032
1   ...   5   6   7   8   9   10   11   12   13
Bog'liq
bar05 (1) tarjima

9. 1989 yildan hozirgi kungacha Korpus asosidagi MT tadqiqotlari
1980-yillarning oxirigacha boÿlgan MT tadqiqotining asosiy asosi asosan har xil turdagi lingvistik qoidalarga asoslangan
edi: sintaktik tahlil qoidalari, leksik qoidalar, leksik koÿchirish qoidalari, sintaktik hosil qilish qoidalari, morfologiya
qoidalari va boshqalar. Qoidalarga asoslangan Ushbu yondashuv dominant transfer tizimlarida (Ariane, Metal, SUSY,
Mu va Eurotra) eng yaqqol namoyon bo'ldi, lekin u barcha turli tillararo tizimlarning asosini tashkil etdi - asosan
lingvistikaga yo'naltirilgan (DLT va Rosetta) va boshqalar. bilimga asoslangan edi (KANT).
va Sergey Nirenburg 1980-yillarning o'rtalaridan hozirgi kungacha bilimga asoslangan bir qator MT tizimlari bilan tajriba
o'tkazdi. Metodologiya "tillararo paradigmada ma'noga yo'naltirilgan MT" sifatida tavsiflanadi. Har ikki yo'nalishda ingliz
va yapon tillari uchun ishchi prototip shaxsiy kompyuter qo'llanmalarini tarjima qilish uchun mo'ljallangan. Asosiy
komponentlar domen uchun kichik kontseptsiya leksikasi, ikki til uchun tahlil va avlod leksikalari, semantik cheklovlarga
ega sintaktik tahlilchi, semantik mapper (semantik talqin qilish uchun), interaktiv "augmentor", TL sintaktik tuzilmalarini
ishlab chiqaruvchi semantik generatorni o'z ichiga oladi. leksik tanlash va maqsadli jumlalarni yaratish uchun sintaktik
generator bilan.
Biroq, 1989 yildan boshlab, qoidalarga asoslangan yondashuvning ustunligi endi "korpusga asoslangan" usullar deb
ataladigan yangi usullar va strategiyalarning paydo bo'lishi bilan buzildi. Birinchidan, IBM guruhi 1988 yilda faqat
statistik usullarga asoslangan tizim bo'yicha tajribalar natijalarini nashr etdi. Usulning samaradorligi ko'plab
tadqiqotchilarni hayratda qoldirdi va keyingi yillarda boshqalarni turli xil statistik usullar bilan tajriba o'tkazishga
ilhomlantirdi. Ikkinchidan, xuddi shu vaqtda ayrim yapon guruhlari tarjima misollari jamlanmasiga asoslangan usullardan
foydalangan holda dastlabki natijalarni e'lon qila boshladilar, ya'ni hozirda odatda "misolga asoslangan" tarjima deb
ataladigan yondashuvdan foydalangan holda. Ikkala yondashuv uchun ham asosiy xususiyat shundan iboratki,
matnlarni tahlil qilishda yoki leksik ekvivalentlarni tanlashda hech qanday sintaktik yoki semantik qoidalar qo'llanilmaydi.
Ko'pgina tadqiqotchilarni (ayniqsa, qoidalarga asoslangan yondashuvlar bilan shug'ullanuvchilarni) hayratda qoldirgan
narsa, natijalar juda maqbul bo'lganligi edi: tarjima qilingan iboralarning deyarli yarmi yoki korpusdagi tarjimalarga to'liq
mos keladi yoki bir xil ma'noni bir oz boshqacha so'zlar bilan ifodalaydi yoki boshqalarni teng ravishda taklif qiladi.
qonuniy tarjimalar. Shubhasiz, tadqiqotchilar ushbu natijalarni yaxshilashga intilishdi va IBM guruhi yanada murakkab
statistik usullarni joriy etishni taklif qilmoqda, ammo ular ba'zi minimal lingvistik ma'lumotlardan foydalanishni maqsad
qilganlar, masalan, fe'lning barcha morfologik variantlarini bitta so'z sifatida ko'rib chiqish. , va manba tuzilmalarini
maqsadli tilga yaqinlashtirish uchun sintaktik transformatsiyalardan foydalanish.
Tahlil va avlod leksikasidagi tushuncha leksikasi va semantik ma’lumotlar (ya’ni semantik cheklovlarni belgilash) tildan
mustaqil, lekin sohaga xosdir. Tizimning o'zagi matnlarni takliflar tarmog'i shaklida tillararo ifodalashdir. Ular semantik
tahlil va interaktiv disambiguatsiya jarayonlaridan kelib chiqqan holda "ko'taruvchi" tomonidan "kontseptsiya leksikasi"
bo'yicha bilimlarga havola qilinadi. 1980-yillarning oxiriga kelib, Karnegi-Mellon jamoasi o'zining KANT prototip tizimini
to'liq ishlab chiqdi va bilimga asoslangan operatsion tizimni ishlab chiqishga tayyor edi (quyida 10-bo'limga qarang).
Machine Translated by Google


Katta korpuslarning mavjudligi bilish va idrokni hisoblash modellashtirishdan kelib chiqadigan usullarda tajriba
o'tkazishni, xususan, parallel hisoblash, neyron tarmoqlar yoki ulanish bo'yicha tadqiqotlarni rag'batlantirdi. Tabiiy
tilni qayta ishlashda bog'lanish modellari grammatik kategoriyalar (sintaktik naqshlarda) va leksik elementlar
(semantik tarmoqlar) o'rtasidagi eng kuchli bog'lanishni aniqlashga "o'rgatiladi". An'anaviy yondashuvlarda to'g'ri
grammatik va semantik qoidalarni shakllantirish qiyinchiliklarini hisobga olgan holda, MTga potentsial aloqadorlik
tahlil qilish va uzatish operatsiyalari uchun etarlicha aniq. Biroq, hozircha, MT doirasida faqat bir nechta guruhlar
bu doirada kichik miqyosdagi tadqiqotlarni amalga oshirgan.
Ariane va Eurotraning nazariy asoslari juda boshqacha ko'rinishda, Frantsiya milliy MT loyihasi Calliopeda Arianeni
rivojlantirish uchun asos solingan Grenoble kompaniyasining B'VITAL kompaniyasini sotib olgan frantsuz
kompaniyasi SITEda joylashgan Eurolang loyihasida saqlanib qolgan. Eurolang loyihasi, shuningdek, Germaniyaning
Siemens-Nixdorf kompaniyasini o'z ichiga oladi, u o'zining transferga asoslangan METAL tizimi bilan hissa qo'shadi.
Eurolang o'nta til juftligini ishlab chiqmoqda, ingliz tilidan frantsuz, nemis, italyan va ispan tillariga va frantsuz tilidan
nemis tiliga va undan. Biroq, Eurolangning birinchi mahsuloti MT tizimi emas, balki MT modulini o'z ichiga olgan
(nafaqat METAL, balki Logos tizimlari uchun ham) tarjimonning ish stantsiyasi, Optimizer bo'ldi.
1990 yildan beri asosiy yangilik korpusga asoslangan yondashuvlarning o'sishi bo'lsa-da, qoidaga asoslangan
tadqiqotlar ham transfer, ham tillararo tizimlarda davom etmoqda. Misol uchun, Eurotra bilan shug'ullangan bir
qator tadqiqotchilar ishlab chiqilgan nazariy yondashuv ustida ishlashni davom ettirdilar, masalan, Saarbryukendagi
CAT2 tizimi va Eurotra tadqiqotining mevalaridan biri Daniyada Daniya/Ingliz tili uchun ishlab chiqilgan PaTrans
uzatishga asoslangan tizim bo'ldi. patentlarni tarjima qilish.
Asosiy gipoteza shundan iboratki, tarjima ko‘pincha o‘xshash misollarni topish yoki eslab qolishni o‘z ichiga oladi,
ya’ni ma’lum bir ibora yoki ba’zi shunga o‘xshash iboralar avval qanday tarjima qilinganligi. Misolga asoslangan
yondashuv statistik usullar (ehtimol, IBM guruhi tomonidan qo'llaniladiganlarga o'xshash) yoki an'anaviy qoida
bo'yicha moslashtirilgan parallel ikki tilli matnlar ma'lumotlar bankidan ekvivalent iboralar yoki so'z guruhlarini
ajratib olish va tanlash jarayonlariga asoslanadi. -morfologik va sintaktik tahlil usullariga asoslangan. Muvofiqliklarni
hisoblash uchun ba'zi MT guruhlari semantik usullardan foydalanadi, masalan, semantik tarmoq yoki domen
atamalarining ierarxiyasi (thesaurus). Boshqa guruhlar maqsadli tildagi leksik chastotalar haqidagi statistik
ma'lumotlardan foydalanadilar. Yondashuvning asosiy afzalligi shundaki, matnlar professional tarjimonlar tomonidan
yaratilgan haqiqiy tarjimalar ma'lumotlar bankidan olinganligi sababli, natijalar aniq va idiomatik bo'lishiga ishonch
bor.
Birinchi marta 1984 yilda Makoto Nagao tomonidan taklif qilingan bo'lsa-da, 1980-yillarning oxiriga kelib, tajribalar
dastlab ba'zi yapon guruhlarida va DLT loyihasi davomida (yuqorida aytib o'tilganidek) boshlandi.

Download 0,57 Mb.

Do'stlaringiz bilan baham:
1   ...   5   6   7   8   9   10   11   12   13




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish