1)tipik tarjima usullari, transformatsiyani yuzaga keltirish;
2)avtomatik tarjima tizimi statistikasini o‘rganish;
3)bir va ko‘p tilli lug‘atlar yaratish;
4)ma’lumotni saqlash, uzatish dasturlarini o‘rganish, baholash;
5)tarjimaning to‘g‘riligini avtomatik tarzda tekshirish;
6)ekvivalent tanlash imkoni kengligi orqali tarjimon mehnatini osonlashtirish.
Paralel korpusning umumuy xarakteristikasi.
Parallel korpus(Parallel corpora)- parallel tarjima matnlarining electron analogi; ko’plab “original matn va ularning bir/bir necha tarjimasi” bloklaridan iborat. Korpusdagi electron matnlar o’zi yoki uning bir qismi bo’lishi mumkin. Parallel korpus – original matn va uning tarjimasi yig’ilgan korpus.
Parallel korpusning tuzilishi, tarkibi va imkoniyati haqidagi ma’lumotlarni D.O.Dobrovolskiy, Yu.Tao, V.Zaxarov, A.A.Kokoreva, E.P.Sosinalarning ishlarida kuzatamiz.
19. Korpus lingvistikasining shakllanishi, taraqqiyoti hamda bugungi holati. Birinchi va ikkinchi avlod korpuslari.
КОРПУС ЛИНГВИСТИКАСИ – тилшуносликнинг корпус, унинг турлари,
7 www.sit.tj.
тарихи, тараққиёти, бугунги ҳолати, корпус тузиш
тамойилларини ўрганувчи бўлими. Корпус лингвистикаси
компьютер лингвистикасининг жуда тез ривожланётган
соҳаси; ушбу фан жаҳоннинг етакчи олий таълим
муассасаларида ўқитилади. Бу соҳа предмети корпус
яратиш назарияси ва амалиёти бўлса, фан сифатида
корпуснинг ўзига хослиги, дастурлаш (ва ҳ.к.) масалалари
ўқитилади. Корпус лингвистикаси компьютер лингвистикасининг таркибий қисми; тил корпусини яратиш,
компьютер технологияси ёрдамида улардан фойдаланишнинг умумий назарияси ва амалиёти билан шуғулланади.
БИРИНЧИ АВЛОД КОРПУСЛАРИ – электрон шаклдаги
разметкаланмаган корпус. Компьютернинг пайдо бўлиши
ёзма (ноэлектрон) корпусларнинг йўқолишига олиб
келмади. Ҳозир ҳам тилшуносликнинг бир қанча соҳаси
учун картон картотека, сопол бўлакларига ёзилган
материал билан ишлаш муҳим ҳисобланади. Айрим тил,
матнлар тадқиқи учун мисол, фактни корпус типи ҳамда
миқдорида ёйма шаклда ўрганиш муҳимлиги кузатилади.
Корпус лингвистикасининг локомативи - инглиз тили.
Бугунги кунда ҳеч ким инглиз тилидаги оддий матнларни
йиғиш ҳақида ўйлаб ўтирмайди, чунки бу тилнинг барча
варианти учун жуда катта ҳажмли, чуқур грамматик
таҳлилга эга (аннотацияланган) корпуслар мавжуд.
“Аннотацияланган корпус” давригача корпуслар аниқ
мақсадли тўпланган, системалаштирилган матнлар
йиғиндисидангина иборат эди. Бунга илк инглиз тили
(Brown corpus, 1960 й.), рус тили (Уппсальский корпус
русских текстов, 1980 й.) корпуслари мисол бўла олади.
Шу тариқа илк электрон корпуслар ўз аждодидан фақат
маълумотни сақлаш шакли ҳамда сезиларли даражада
ҳажмнинг кенгайиши билан фарқ қилди.
Do'stlaringiz bilan baham: |