Mashina tarjimasi


-1989 yillardagi tadqiqotlar



Download 0,57 Mb.
Pdf ko'rish
bet8/13
Sana21.05.2022
Hajmi0,57 Mb.
#606032
1   ...   5   6   7   8   9   10   11   12   13
Bog'liq
bar05 (1) tarjima

7. 1976-1989 yillardagi tadqiqotlar
O'zining tillararo tizimi muvaffaqiyatsizlikka uchraganidan so'ng, Grenoble guruhi (GETA, Groupe d'Etudes pour
la Traduction Automatique) o'zining nufuzli Ariane tizimini ishlab chiqishni boshladi. "Ikkinchi avlod" tilshunoslikka
asoslangan uzatish tizimlarining paradigmasi sifatida ko'rilgan Ariane 1980-yillarda butun dunyo bo'ylab
loyihalarga ta'sir ko'rsatdi. Uning moslashuvchanligi va modulliligi, kuchli daraxt o'tkazgichlari va statik va dinamik
grammatika tushunchasi alohida e'tiborga loyiq edi. Turli darajalar va vakillik turlari (bog'liqlik, iboralar tuzilishi,
mantiqiy) bitta yorliqli daraxt tuzilmalariga kiritilishi mumkin va shuning uchun ko'p darajali uzatish namoyishlarida
sezilarli moslashuvchanlikni ta'minlaydi. GETA ayniqsa mashhur edi
Machine Translated by Google


Saarbryukkenda (Germaniya) eksperimental tadqiqotlar 1967 yilda boshlangan. 1970-yillarning oÿrtalaridan 1980-
yillarning oxirigacha guruh SUSY (Saarbrücker Übersetzungssystem) ni ishlab chiqdi, u yuqori modulli koÿp tilli
uzatish tizimini lingvistik tuzilmalar, oÿzgarishlar qoidalarining taÿsirchan xilma-xilligini koÿrsatadi: hol
grammatikasi va valentlik ramkalari, bogÿliqlik grammatikasi va turli xil amal turlari: qoidaga asoslangan,
leksikaga asoslangan, jadvalga asoslangan, statistik maÿlumotlardan foydalanish, afzallik qoidalari va boshqalar.
Uning asosiy yoÿnalishi flektiv tillarni chuqurroq oÿrganish edi. rus va nemis kabi, lekin boshqa ko'plab tillar,
xususan, ingliz tili ham tekshirildi. Boshqa loyihalar orasida semantik tarmoqlardan foydalangan holda frantsuz-
germaniya tizimi (ASCOF); va yapon ilmiy maqolalarining sarlavhalarini nemis tiliga tarjima qilish uchun Fujitsu
ATLAS tizimidan olingan ma'lumotlarni aylantirish uchun nemis generatorini (SEMSYN) ishlab chiqish.
1980-yillarning ikkinchi yarmida tillararo tizimlarga qiziqishning umumiy jonlanishi kuzatildi. Ba'zilari kichik va
qisqa muddatli edi, masalan, Boliviyadan olingan ATAMIRI tizimi (birinchi navbatda ingliz va ispan tillari uchun)
Janubiy Amerika tili Aymara tiliga asoslangan. Gollandiya, Yaponiya va Qo'shma Shtatlardagi loyihalar muhimroq
edi, ba'zilari sun'iy intellekt bo'yicha tadqiqotlardan bilimga asoslangan usullardan foydalanishni boshladilar.
Eurotra tadqiqotchilari MTning nazariy asoslarini sezilarli darajada rivojlantirdilar va sintaktik nazariya, rasmiy
tahlil nazariyasi va nutq tahliliga muhim hissa qo'shdilar. Eurotra loyihasining maqsadlaridan biri bunday
tadqiqotlarni rag'batlantirish edi va bu muvaffaqiyatga erishdi. Biroq, u ishlaydigan prototipni ishlab chiqarmadi
va loyihaning oxiriga kelib sanoat sherikliklarini jalb qilishga urinishlar samarasiz bo'ldi. Ariane singari,
ishtirokchilar tomonidan osonlikcha tan olinadigan asosiy kamchilik leksika muammolarini ham nazariy, ham
amaliy jihatdan hal qila olmaganligi edi. 1970-yillarning oxirida Eurotra eng yaxshi "tilshunoslikka asoslangan"
dizayn sifatida ko'rilgan bo'lsa, 1980-yillarning oxirida ko'pchilik uni kontseptsiyada eskirgan deb hisobladi va
1992 yilga kelib Eurotra amalda tugadi.
GETA-Ariane dizayniga o'xshash kontseptsiya Kioto universitetida Makoto Nagao boshchiligida ishlab chiqilgan
Mu tizimi edi. Mu-ning ko'zga ko'ringan xususiyatlari - holatlar grammatikasini tahlil qilish va bog'liqlik daraxti
ko'rinishlaridan foydalanish va grammatika yozish uchun dasturlash muhitini ishlab chiqish (GRADE). Kioto
tadqiqoti keyingi ko'plab Yaponiya MT tadqiqot loyihalarida va 1980-yillardagi ko'plab yapon tijorat tizimlarida
juda ta'sirli bo'ldi. 1986 yildan boshlab tadqiqot prototipi Yaponiyaning fan va texnologiya axborot markazi
tomonidan tezislarni tarjima qilish uchun foydalanish uchun operatsion tizimga aylantirildi va ishlab chiqildi.
xalqaro hamkorlikni rag'batlantirish va MT tadqiqotchilarni tayyorlashda, ayniqsa Janubi-Sharqiy Osiyoda.
Ariane operatsion tizimga aylanmadi (1980-yillarning o'rtalarida Frantsiyaning Callliope milliy loyihasida ishtirok
etishiga umid qilganiga qaramay) va tizim bo'yicha faol tadqiqotlar 1980-yillarning oxirida to'xtadi. U B'VITAL
tomonidan sinchkovlik bilan sinovdan o'tkazildi va 1990-yillarda Eurolang loyihasining bir qismiga aylandi,
Grenobl jamoasi esa boshqa yo'nalishlarda MT tadqiqotlarini davom ettirdi (quyida 10-qismga qarang).
Bu davrda Eurotra boshqa ko'plab innovatsion nazariy lingvistik va kompyuter lingvistik tadqiqotlarni, xususan,
Niderlandiya, Belgiya, Daniya, Germaniya va Buyuk Britaniyada rag'batlantirdi.
1980-yillarning eng mashhur loyihalaridan biri Yevropa hamjamiyatlarining Eurotra loyihasi edi. Uning maqsadi
barcha Hamjamiyat tillari orasida tarjima qilish uchun ilg'or ko'p tilli uzatish tizimini yaratish edi. Uning umumiy
dizayni GETA-Ariane va SUSY tizimlariga juda ko'p qarzdor edi. Ular kabi, bu ko'p tilli tarjima uchun mo'ljallangan
tilshunoslikka asoslangan modulli uzatish tizimi bo'lib, sifatli, ammo mukammal emas edi. Dizayn leksik, mantiqiy-
sintaktik va semantik ma'lumotlarni ko'p darajali interfeyslarda yuqori darajada mavhumlik bilan birlashtirgan.
Tildan tashqari bilim bazalaridan yoki xulosa qilish mexanizmlaridan to'g'ridan-to'g'ri foydalanilmagan va tarjima
jarayonida inson yordami yoki aralashuvi uchun hech qanday qulayliklar kiritilmagan. U ommaviy qayta ishlash
va inson tomonidan keyingi tahrirlashni nazarda tutgan.
Utrextdagi (Niderlandiya) BSO dasturiy ta'minot kompaniyasida DLT (Distributed Language Translation) tizimi
1985 yildan boshlab Toon Witkam bosh rahbarligida olti yillik loyiha edi. U kompyuter tarmoqlari orqali ishlaydigan
ko'p tilli interaktiv tizim sifatida mo'ljallangan edi, bunda har bir terminal faqat bitta tildan va tilga tarjima qilish
mashinasi bo'lishi kerak edi; matnlar terminallar o'rtasida vositachi tilda uzatilishi kerak edi. O'zining interlingua
sifatida DLT esperanto tilining o'zgartirilgan shaklini tanladi.
Machine Translated by Google


Gollandiyadagi ikkinchi interlingua loyihasi boshqa jihatdan innovatsion edi. Bu Yan Landsbergen
tomonidan Flibs (Eindhoven) da Rosetta loyihasi edi. Uch tilni (ingliz, golland va ispan) o'z ichiga olgan
ushbu eksperimental tizimning dizaynerlari tillararo vakilliklarda Montague grammatikasidan foydalanishni
o'rganishni tanladilar. Asosiy xususiyat - kompozitsionlik tamoyiliga amal qilgan holda, iboralarning
sintaktik tuzilishidan semantik vakilliklarning kelib chiqishi; har bir sintaktik hosila daraxti uchun tegishli
semantik hosila daraxti bo'lishi kerak edi va bu semantik hosila daraxtlari tillararo vakillik edi. Ikkinchi
xususiyat grammatikaning teskariligini o'rganish edi, bu ko'plab keyingi MT loyihalarining xususiyati.
1980-yillarning ikkinchi yarmida sintaktik nazariya, xususan, unifikatsiya grammatikasi, leksik funksional
grammatika va davlat bogÿlash nazariyasidagi oÿzgarishlar tadqiqotchilarni oÿziga jalb qila boshladi,
garchi ularning asosiy taÿsiri 1990-yillarda boÿlgan boÿlsa ham. O'sha paytda ko'plab kuzatuvchilar MT
sifatini yaxshilash usullarining eng ehtimol manbai sun'iy intellekt (AI) kontekstida tabiiy tilni qayta
ishlash bo'yicha tadqiqotlarda ekanligiga ishonishgan. MT tadqiqotlarida AI usullarini o'rganish 1970-
yillarning o'rtalarida Yorik Uilksning "afzal semantika" va "semantik shablonlar" ustidagi ishi bilan
boshlandi. Keyingi ilhom Yel universitetida Rojer Shankning tadqiqotlaridan, xususan, ekspert tizimlari
va matnni “tushunish”ga bilimga asoslangan yondashuvlarni ishlab chiqishdan olingan.
O'n yillikning oxiriga qadar Sovet Ittifoqida ham faollikning o'sishi kuzatildi. ALPAC hisoboti 1970-yillarda
salbiy ta'sir ko'rsatdi va bir qator ilg'or MT loyihalari yordamni yo'qotdi. 1976 yildan boshlab tadqiqotning
asosiy qismi Moskvadagi Butunittifoq tarjima markazida amalga oshirildi. Ingliz-rus (AMPAR) va nemis-
ruscha tarjima (NERPA) tizimlari to'g'ridan-to'g'ri yondashuv asosida ishlab chiqilgan va Yuriy Apresyan
rahbarligida frantsuz-rus (FRAP) uchun yanada takomillashtirilgan uzatish tizimi bo'yicha ish davom
etgan bo'lsa-da, ko'pchilik faollik. Sovet Ittifoqida ko'pincha statistik tahlillardan foydalanishni o'z ichiga
olgan nisbatan past darajadagi operatsion tizimlarni ishlab chiqarishga qaratilgan.
Lingvistik va tildan tashqari ma'lumotlarning kombinatsiyasidan tizim qaramlik bilan bog'langan tillararo
so'zlar juftligi uchun ehtimollik ballarini hisoblab chiqdi. Loyiha katta leksik ma'lumotlar bazalarini
yaratishda katta kuch sarfladi va uning so'nggi yillarida (inson) tarjima qilingan matnlar korpusidan ikki
tilli bilimlar bankini qurish taklif qilindi (Sadler 1989). Bir qator jihatlarda DLT 1990-yillarda yanada
yaqqolroq bo'lgan o'zgarishlarning kashshofi edi.
Tahlil asosan morfologik va sintaktik xususiyatlar bilan chegaralangan (bog'liqlik grammatikasida
rasmiylashtirilgan); kiritishning semantik tahlili yo'q edi. Disambiguatsiya markaziy interlingua
komponentida sodir bo'ldi, bu erda semantik-leksik bilimlar Esperanto ma'lumotlar bazasida aks ettirilgan.
Shimoliy Amerika, G'arbiy Evropa va Yaponiyadan tashqari, MT tadqiqotlari 1980-yillarning ikkinchi
yarmida Koreyada (ba'zan yapon va amerikalik guruhlar bilan hamkorlikdagi loyihalarda), Tayvanda
(masalan, ArchTran tizimi), materik Xitoyda ham faollashdi. qator institutlar va Janubi-Sharqiy Osiyoda,
xususan, Malayziyada. Ushbu tadqiqotning ba'zilari Yaponiya CICC (Kompyuterlashtirish bo'yicha
xalqaro hamkorlik markazi) boshchiligidagi ko'p tilli ko'p millatli MMT loyihasi tomonidan rag'batlantirildi,
lekin umuman olganda, bu, xususan, elektronika va hisoblash sanoatida tijorat kengayishiga olib keldi.
Yaponiyadagi MT tadqiqotlari dastlab Kioto universitetida Mu loyihasi katta ta'sir ko'rsatdi, turli xil
yondashuvlarni ko'rsatdi. Transfer tizimlari ustunlik qilgan bir paytda bir qancha tillararo tizimlar
(masalan, NEC kompaniyasining PIVOT tizimi, hozirda tijoratda mavjud) va bilimga asoslangan tajribalar
(masalan, NTTdagi LUTE loyihasi va Canonning Lamb tizimi) mavjud edi. Yaponiya, shuningdek, 1980-
yillarning o'rtalarida Xitoy, Indoneziya, Malayziya va Tailand ishtirokchilari va Yaponiyaning yirik tadqiqot
institutlari, jumladan Tokiodagi hukumat elektrotexnika laboratoriyasi (ETL) ishtirokida o'zining ko'p tilli
ko'p millatli loyihasini boshladi. Aniqlash uchun bilimga asoslangan kontekstual tahlil bilan ambitsiyali
interlingua yondashuvi qabul qilindi. Loyiha bugungi kungacha davom etmoqda.
Bir qator loyihalar bilimga asoslangan yondashuvlarni, xususan, bilim banklaridan foydalanishni qo'lladi
- ba'zilari Yaponiyada (masalan, yapon ko'p tilli loyihasi uchun ETL tadqiqoti), boshqalari Evropada
(masalan, Saarbryuken va Shtutgartda) va ko'plari Shimoliy Amerikada. Eng muhim tadqiqot
Pitsburgdagi Karnegi-Mellon universitetida Jaime Carbonell boshchiligida olib borildi.
Machine Translated by Google


Eng dramatik rivojlanish IBM’dagi Candide loyihasida MTga statistik ma’lumotlarga asoslangan yondashuvning qayta
tiklanishi bo‘ldi. Statistik usullar MT tadqiqotining dastlabki davrida, 1960-yillarda keng tarqalgan edi (yuqoridagi 3-
qismga qarang), lekin natijalar umuman umidsizlikka uchragan edi. Nutqni aniqlashda yangi stoxastik usullarning
muvaffaqiyati bilan Yorktown Heightsdagi IBM jamoasi MTga qo'llanilishini qayta ko'rib chiqishni boshladi. Kandidning
o'ziga xos xususiyati shundaki, statistik usullar tahlil qilish va yaratishning deyarli yagona vositasi sifatida qo'llaniladi;
lingvistik qoidalar qo'llanilmaydi. IBM tadqiqoti Kanada parlament munozaralari hisobotlarida (Kanada Hansard) mavjud
bo'lgan fransuz va ingliz matnlarining keng jamlanmasiga asoslangan. Usulning mohiyati birinchi navbatda iboralarni,
so'z turkumlarini va parallel matnlarning alohida so'zlarini moslashtirish, so'ngra bitta tildagi jumladagi har qanday so'z
tarjima qilingan jumladagi so'z yoki so'z bilan mos kelishi ehtimolini hisoblashdan iborat. boshqa tilda moslashtirilgan.
Ikkinchi asosiy “korpusga asoslangan” yondashuv – matn korpusining katta ma’lumotlar banklariga tezkor kirishni
yaxshilashdan ham foyda ko‘radi – “misolga asoslangan” (yoki “xotiraga asoslangan”) yondashuv sifatida tanilgan.

Download 0,57 Mb.

Do'stlaringiz bilan baham:
1   ...   5   6   7   8   9   10   11   12   13




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish