Mustaqil ishi mashina tarjimasida taxlil masalasi mashina tarjimasida lingvistik muammolar



Download 53,77 Kb.
bet2/3
Sana18.04.2022
Hajmi53,77 Kb.
#561529
1   2   3
Bog'liq
MASHINA TARJIMASIDA TAXLIL MASALASI MASHINA TARJIMASIDA LINGVISTIK MUAMMOLAR

Mashina tarjimasi
Mashina tarjimasi, ba'zan qisqartirish bilan ataladi MT[1] (bilan aralashmaslik kerak kompyuter yordamida tarjima qilish, avtomatlashtirilgan inson tarjimasi yoki interaktiv tarjima), ning pastki maydonidir hisoblash lingvistikasi uchun dasturiy ta'minotdan foydalanishni tekshiradigan tarjima qilish bittadan matn yoki nutq til boshqasiga.
Asosiy darajada MT bir tilda so'zlarni boshqa tildagi so'zlarga mexanik almashtirishni amalga oshiradi, ammo bu kamdan-kam hollarda yaxshi tarjima hosil qiladi, chunki butun til birikmalarini va ularning maqsad tilidagi eng yaqin hamkasblarini tanib olish kerak. Bitta tildagi so'zlarning barchasi boshqa tilda teng so'zlarga ega emas va ko'p so'zlar bir nechta ma'noga ega.
Ushbu muammoni hal qilish korpus statistik va asabiy texnika - bu tez rivojlanayotgan soha, tarjimalarni yaxshilashga, farqlar bilan ishlashga olib keladi lingvistik tipologiya, tarjima iboralarva anomaliyalarni ajratish.[2][tekshirib bo'lmadi]
Mashinalarni tarjima qilishning joriy dasturi ko'pincha domen yoki kasb (kabi ob-havo ma'lumotlari), ruxsat etilgan almashtirishlar doirasini cheklash orqali mahsulotni yaxshilash. Ushbu uslub ayniqsa rasmiy yoki formulali til ishlatilgan sohalarda samarali bo'ladi. Bundan kelib chiqadiki, hukumat va yuridik hujjatlarning mashinada tarjimasi suhbatga yoki kamroq standartlangan matnga qaraganda osonroq foydalanishga imkon beradi.
Yaxshilangan mahsulot sifati inson aralashuvi bilan ham ta'minlanishi mumkin: masalan, ba'zi tizimlar foydalanuvchi aniqroq tarjima qila oladi shubhasiz aniqlandi matndagi qaysi so'zlar maxsus ismlar. Ushbu usullar yordamida MT inson tarjimonlariga yordam berish vositasi sifatida foydalandi va juda cheklangan hollarda hattoki ishlatilishi mumkin bo'lgan mahsulotni ishlab chiqarishi mumkin (masalan, ob-havo ma'lumotlari).
Mashinaviy tarjimaning taraqqiyoti va salohiyati uning tarixi davomida juda ko'p bahs qilingan. 1950-yillardan boshlab, bir qator olimlar, birinchi navbatda va eng muhimi Yehoshua Bar-Xill,[3] to'liq avtomatik ravishda yuqori sifatli mashinaga tarjima qilish imkoniyatini shubha ostiga qo'ydi.[4][sahifa kerak]
Tarix
Asosiy maqola: Mashina tarjimasi tarixi
Kelib chiqishi
Mashinaviy tarjimaning kelib chiqishi asarlaridan kelib chiqishi mumkin Al-Kindi, 9-asr arab kriptograf tilni tizimli tarjima qilish texnikasini ishlab chiqqan, shu jumladan kriptanaliz, chastota tahliliva ehtimollik va statistika, bu zamonaviy mashinaviy tarjimada qo'llaniladi.[5] Mashina tarjimasi g'oyasi keyinchalik 17-asrda paydo bo'ldi. 1629 yilda, Rene Dekart universal tilni taklif qildi, turli xil tillarda ekvivalent g'oyalar bitta belgini baham ko'rdi.[6]
Tabiiy tillarni tarjima qilish uchun raqamli kompyuterlardan foydalanish g'oyasi 1946 yildayoq Angliya tomonidan taklif qilingan edi A. D. Booth va Uorren Uayver da Rokfeller jamg'armasi xuddi shu paytni o'zida. "Memorandum tomonidan yozilgan Uorren Uayver 1949 yilda, ehtimol mashina tarjimasining dastlabki kunlaridagi eng nufuzli nashr. "[7][8] Boshqalar ham ergashdilar. 1954 yilda namoyish o'tkazildi APEXC mashina Birkbek kolleji (London universiteti) ingliz tilini frantsuz tiliga dastlabki tarjimasi. O'sha paytda ushbu mavzu bo'yicha bir nechta maqolalar va hatto mashhur jurnallarda nashr etilgan maqolalar (masalan, 1955 yil sentyabr oyidagi Kliv va Zacharovlarning maqolalari) Simsiz dunyo). Xuddi shunday dastur, o'sha paytda Birkbek kollejida ham kashshof bo'lgan, o'qish va yozish edi Brayl shrifti kompyuter orqali matnlar.
1950-yillar
Ushbu sohadagi birinchi tadqiqotchi Yehoshua Bar-Xill o'z tadqiqotlarini MITda boshladi (1951). A Jorjtaun universiteti Professor Maykl Zarechnak boshchiligidagi MT tadqiqot guruhi (1951) jamoatchilik namoyishida qatnashdi Jorjtaun-IBM tajribasi Yaponiyada MT tadqiqot dasturlari paydo bo'ldi[9][10] va Rossiya (1955) va birinchi MT konferentsiyasi Londonda (1956) bo'lib o'tdi.[11][12]
Devid G. Xeys "1957 yilda kompyuter yordamida tilni qayta ishlash to'g'risida yozgan" va "hisoblash lingvistikasi bo'yicha loyiha rahbari bo'lgan Rand 1955 yildan 1968 yilgacha. "[13]
1960–1975
Tadqiqotchilar ushbu sohaga qo'shilishni davom ettirdilar, chunki AQShda Mashina tarjimasi va hisoblash lingvistikasi assotsiatsiyasi (1962) va Milliy Fanlar Akademiyasi MTni o'rganish uchun Tilni Avtomatik qayta ishlash bo'yicha maslahat qo'mitasini (ALPAC) tashkil etdi (1964). Haqiqiy taraqqiyot ancha sekinroq edi, ammo keyin ALPAC hisoboti O'n yillik tadqiqotlar kutilgan natijalarni bajarmaganligini aniqlagan (1966), mablag 'juda kamaydi.[14] Mudofaa tadqiqotlari va muhandisligi direktorining (DDR & E) 1972 yilgi hisobotiga ko'ra, o'sha mojaro paytida Logos MT tizimining harbiy qo'llanmalarni Vetnam tiliga tarjima qilishdagi muvaffaqiyati tufayli katta miqyosli MTning texnik imkoniyatlari tiklandi.
Frantsuz To'qimachilik Instituti ham tezislarni frantsuz, ingliz, nemis va ispan tillaridan tarjima qilishda MT dan foydalangan (1970); Brigham Young universiteti mormon matnlarini avtomatlashtirilgan tarjima orqali tarjima qilish loyihasini boshladi (1971).
1975 va undan keyin
SISTRAN"U. S. hukumatining shartnomalari bo'yicha maydonni kashshof qilgan"[1] 1960-yillarda Xerox tomonidan texnik qo'llanmalarni tarjima qilishda foydalanilgan (1978). 1980-yillarning oxiridan boshlab hisoblash kuch oshdi va arzonlashdi, ko'proq qiziqish paydo bo'ldi mashinada tarjima qilishning statistik modellari. MT kompyuterlar paydo bo'lgandan keyin yanada ommalashdi.[15] SYSTRANning birinchi amalga oshirish tizimi 1988 yilda. Ning onlayn xizmati tomonidan joriy qilingan Frantsiya pochta xizmati Minitel deb nomlangan.[16] Turli xil MT kompaniyalari ham ishga tushirildi, shu jumladan Trados (1984), birinchi bo'lib tarjima xotirasi texnologiyasini ishlab chiqdi va sotdi (1989). Rus / ingliz / nemis-ukrain tilidagi birinchi tijorat MT tizimi Xarkov davlat universitetida ishlab chiqilgan (1991).
1998 yilga kelib, kompyuterda ishlash uchun "29.95 dollarga" ingliz tili va sizning tanlagan asosiy Evropa tili o'rtasida bir yo'nalishda tarjima qilish uchun dastur sotib olish mumkin edi.[1]
Internetdagi MT kichik hajmdagi matnlarni bepul tarjima qilishni taklif qiluvchi SYSTRAN (1996) va keyin AltaVista Babelfish orqali taqdim etish bilan boshlandi.[1] kuniga 500000 so'rovni to'ldirgan (1997).[17] Internetda ikkinchi bepul tarjima xizmati bo'ldi Lernout va XauspiGlobaLink.[1]Atlantika jurnali 1998 yilda "Systran's Babelfish and GlobaLink's Comprende" "bunga bank qilmang" bilan "vakolatli ishlash" bilan shug'ullanganligini yozgan.[18]
Frants Yozef Och (tarjimani rivojlantirish AT Google-ning kelajakdagi rahbari) DARPA-ning tezkor MT tanlovida g'olib bo'ldi (2003).[19] Shu vaqt ichida ko'proq yangiliklarga MOSES, ochiq manbali statistik MT dvigatel (2007), Yaponiyada mobil telefonlar uchun matnli / SMS tarjima xizmati (2008) va ingliz tiliga so'zma-so'z tarjima qilish funksiyasi o'rnatilgan mobil telefon kiradi. , Yapon va xitoy (2009). 2012 yilda Google buni e'lon qildi Google tarjima bir kunda 1 million kitobni to'ldirish uchun etarlicha matnni tarjima qiladi.
Tarjima jarayoni
Asosiy maqola: Tarjima jarayoni
Inson tarjima jarayoni quyidagicha tavsiflanishi mumkin:

  1. Kod hal qilish The ma'no ning manba matni; va

  2. Qaytakodlash bu ma'no maqsadli tilda.

Ushbu go'yo oddiy protsedura ortida murakkab narsa yotadi kognitiv operatsiya. Ning ma'nosini dekodlash uchun manba matni to'liq holda tarjimon matnning barcha xususiyatlarini talqin qilishi va tahlil qilishi kerak, bu jarayon chuqur bilim talab qiladi grammatika, semantik, sintaksis, iboralarva boshqalar, manba tilining, shuningdek, uning ma'ruzachilarining madaniyati. Tarjimon tilidagi ma'nolarni qayta kodlash uchun bir xil chuqur bilimga muhtoj.[20]
Mashinada tarjima qilishda muhim masala: matnni odam kabi "tushunadigan" va maqsadli tilda yangi matnni "yaratadigan" kompyuterni qanday dasturlash kerak. xuddi bir kishi yozgandek tuyuladi. Agar "bilimlar bazasi" yordam bermasa, MT faqat "umumiy", ammo nomukammal bo'lsa-da, asl matnning "mohiyatini" olishiga imkon beradi ("gisting" deb nomlangan jarayon). Bu ko'plab maqsadlar uchun, shu jumladan, to'liq aniqlik ajralmas bo'lgan holatlar uchun ajratilgan inson tarjimonining cheklangan va qimmat vaqtidan unumli foydalanish uchun etarli.
Yondashuvlar

Bernar Vauquoisning vositachilik vakolatxonasining qiyosiy chuqurligini ko'rsatadigan piramida, tillararo mashina tarjimasi eng yuqori nuqtada, so'ngra transferga asoslangan, keyin to'g'ridan-to'g'ri tarjima.
Mashinaviy tarjimada asoslangan usuldan foydalanish mumkin lingvistik qoidalar, bu so'zlarning lingvistik usulda tarjima qilinishini anglatadi - maqsad tilidagi eng mos (og'zaki) so'zlar manba tilidagi so'zlarni o'rnini bosadi.[iqtibos kerak]
Mashina tarjimasining muvaffaqiyati muammoni talab qiladi, deb tez-tez ta'kidlaydilar tabiiy tilni tushunish birinchi bo'lib hal qilinishi kerak.[21]
Odatda, qoidalarga asoslangan usullar matnni tahlil qiladi, odatda vositachi, ramziy tasvirni yaratadi, undan maqsad tilidagi matn yaratiladi. Vositachi vakillik xususiyatiga ko'ra yondashuv quyidagicha tavsiflanadi tillararo mashina tarjimasi yoki transferga asoslangan mashina tarjimasi. Ushbu usullar keng qamrovli narsalarni talab qiladi leksikonlar bilan morfologik, sintaktikva semantik ma'lumotlar va katta qoidalar to'plami.
Etarli ma'lumotlarni hisobga olgan holda, mashinani tarjima qilish dasturlari ko'pincha a uchun yaxshi ishlaydi ona tili boshqa bir ona tili tomonidan yozilgan narsalarning taxminiy ma'nosini olish uchun bitta tilning. Muammo ma'lum bir usulni qo'llab-quvvatlash uchun kerakli turdagi ma'lumotlarni olishdir. Masalan, ko'p tilli korpus statistik usullarning ishlashi uchun zarur bo'lgan ma'lumotlar grammatikaga asoslangan usullar uchun zarur emas. Ammo keyinchalik grammatika metodlari ular foydalanadigan grammatikani puxta ishlab chiqishi uchun malakali tilshunosga muhtoj.
Yaqindan bog'liq tillar o'rtasida tarjima qilish uchun texnika deb nomlanadi qoidalarga asoslangan mashina tarjimasi ishlatilishi mumkin.
Qoida asosida
Asosiy maqola: Qoidalarga asoslangan mashina tarjimasi
Qoidalarga asoslangan mashina tarjimasi paradigmasi translyatsiyaga asoslangan mashina tarjimasi, tillararo mashina tarjimasi va lug'atga asoslangan mashina tarjimasi paradigmalarini o'z ichiga oladi. Ushbu turdagi tarjima asosan yaratishda ishlatiladi lug'atlar va grammatika dasturlari. Boshqa usullardan farqli o'laroq, RBMT morfologik va sintaktik qoidalardan foydalangan holda manba va maqsad tillarning lingvistikasi haqida ko'proq ma'lumotni o'z ichiga oladi. semantik tahlil ikkala tilning. Asosiy yondashuv kirish jumlasining tuzilishini va chiqish jumlasining tuzilishi bilan manba tili uchun ajraluvchi va analizator, maqsadli til uchun generator va haqiqiy tarjima uchun transfer lug'ati yordamida bog'lashni o'z ichiga oladi. RBMT-ning eng katta qulashi shundaki, hamma narsa aniq bo'lishi kerak: orfografik xilma-xillik va noto'g'ri ma'lumotlar manba tili analizatorining bir qismiga aylanishi kerak, bunga bardosh berish uchun va leksik tanlov qoidalari barcha noaniqliklar uchun yozilishi kerak. O'z-o'zidan yangi domenlarga moslashish unchalik qiyin emas, chunki domenlar bo'yicha asosiy grammatika bir xil va domenga xos sozlash leksik tanlovni sozlash bilan cheklangan.
Transfer asosida mashina tarjimasi
Asosiy maqola: Transfer asosida mashina tarjimasi
Transferga asoslangan mashina tarjimasi shunga o'xshash tillararo mashina tarjimasi u asl jumla ma'nosini simulyatsiya qiladigan oraliq vakolatxonadan tarjima yaratishi bilan. Interlingual MT-dan farqli o'laroq, bu qisman tarjimada ishtirok etadigan til juftligiga bog'liq.
Tillararo
Asosiy maqola: Tillararo mashina tarjimasi
Tillararo mashina tarjimasi - qoidalarga asoslangan mashina tarjimasi yondashuvlaridan biri. Ushbu yondashuvda manba tili, ya'ni tarjima qilinadigan matn tillararo tilga aylanadi, ya'ni har qanday tildan mustaqil bo'lgan "til neytral" vakili. So'ngra maqsadli til interlingua. Ushbu tizimning eng katta afzalliklaridan biri shundaki, tillararo tillar soni ortib borishi bilan qadrli bo'ladi. Shu bilan birga, tijorat darajasida ishlaydigan yagona tillararo tarjima tizimi - KANT tizimi (Nyberg va Mitamura, 1992), bu Caterpillar Technical English (CTE) ni boshqa tillarga tarjima qilish uchun mo'ljallangan.
Lug'atga asoslangan
Asosiy maqola: Lug'atga asoslangan mashina tarjimasi
Mashinaviy tarjimada asoslangan usuldan foydalanish mumkin lug'at yozuvlar, ya'ni so'zlar xuddi lug'at bilan tarjima qilinishini anglatadi.
Statistik
Asosiy maqola: Statistik mashina tarjimasi
Statistik mashina tarjimasi yordamida tarjimalarni yaratishga harakat qiladi statistik usullar kabi ikki tilli matn korporatsiyalariga asoslangan Kanadalik Xansard korpus, Kanada parlamentining ingliz-frantsuz yozuvlari va EUROPARL, yozuvlari Evropa parlamenti. Bunday korpuslar mavjud bo'lganda, shunga o'xshash matnlarni tarjima qilishda yaxshi natijalarga erishish mumkin, ammo bunday korporatsiyalar ko'plab til juftliklari uchun kamdan-kam uchraydi. Birinchi statistik mashina tarjima dasturi edi Nomzod dan IBM. Google ishlatgan SISTRAN bir necha yil davomida, ammo 2007 yil oktyabr oyida statistik tarjima uslubiga o'tdi.[22] 2005 yilda Google o'z tizimlarini o'qitish uchun Birlashgan Millatlar Tashkiloti materiallaridan taxminan 200 milliard so'zlardan foydalangan holda ichki tarjima imkoniyatlarini yaxshiladi; tarjima aniqligi yaxshilandi.[23] Google Translate va shunga o'xshash statistik tarjima dasturlari odamlar tomonidan ilgari tarjima qilingan yuz millionlab hujjatlardagi naqshlarni aniqlash va topilmalar asosida aqlli taxminlar qilish orqali ishlaydi. Odatda, ma'lum bir tilda odamlar tomonidan tarjima qilingan hujjatlar qanchalik ko'p bo'lsa, tarjimaning sifatli bo'lishi ehtimoli shunchalik yuqori bo'ladi.[24] METIS II va PRESEMT kabi statistik mashina tarjimasidagi yangi yondashuvlar korpusning minimal hajmidan foydalanadi va buning o'rniga sintaktik tuzilmani naqshni aniqlash orqali chiqarishga e'tibor beradi. Keyinchalik rivojlanish natijasida, bu statistik mashina tarjimasi bir tilli matn korpusi asosida ishlashga imkon berishi mumkin.[25] SMTning eng katta tanazzulga uchrab turishi juda katta miqdordagi parallel matnlarga, uning morfologiyaga boy tillar bilan bog'liq muammolariga (ayniqsa tarjima bilan bog'liq) kiradi. ichiga singleton xatolarini tuzatishga qodir emasligi).
Misolga asoslangan
Asosiy maqola: Namuna asosidagi mashinaviy tarjima
Namuna asosidagi mashina tarjimasi (EBMT) yondashuvi tomonidan taklif qilingan Makoto Nagao 1984 yilda.[26][27] Namuna asosida mashina tarjimasi o'xshashlik g'oyasiga asoslangan. Ushbu yondashuvda ishlatilgan korpus allaqachon tarjima qilingan matnlarni o'z ichiga oladi. Tarjima qilinadigan jumlani hisobga olgan holda, ushbu korpus tarkibidagi o'xshash sub-sententsial komponentlarni o'z ichiga olgan jumlalar tanlanadi.[28]Shunga o'xshash jumlalar asl jumlaning sub-sententsial tarkibiy qismlarini maqsadli tilga tarjima qilish uchun ishlatiladi va ushbu iboralar birlashtirilib, to'liq tarjimani hosil qiladi.
Gibrid MT
Asosiy maqola: Gibrid mashina tarjimasi
Gibrid mashina tarjimasi (HMT) statistik va qoidalarga asoslangan tarjima metodologiyasining kuchli tomonlaridan foydalanadi.[29] Bir nechta MT tashkilotlari ikkala qoidalar va statistik ma'lumotlardan foydalanadigan gibrid yondashuvni da'vo qilishadi. Yondashuvlar bir necha jihatdan farq qiladi:
1   2   3




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish