Tuzilishi, tarkibi va imkoniyati haqida D.O.Dobrovolskiy, Yu.Tao, V.Zaxarov, A.A.Kokoreva, E.P.Sosnina ma’lumot beradi.
Ikki ko‘rinishi muvjud:
ko‘p tilli korpus (Comparable/Multilingual Sorpora);
tarjima korpus (Translation Sorpora).
Tuzilishi va matnlarning joylashuvi, birliklarining moslashtirilishiga ko‘ra parallel korpus ko‘rinishi
bir yo‘nalishli (ingliz tilidan rus tiliga tarjima qilingan matn)
ikki yo‘nalishli (ingliz tilidan rus tiliga tarjima qilingan matn va rus tilidan ingliz tiliga (teskari tarjima))
ko‘p yo‘nalishli (ingliz tilidan rus, nemis, fransuz tillariga tarjima qilingan matn)
Korpuslar tarkibidagi material tiliga ko‘ra, dastlab, bir tilli va ko‘p tilli korpus turlariga bo‘linadi. Ikki yoki ko‘p tilli korpuslar esa quyidagi ko‘rinishga ega: 1) parallel yoki tarjima korpuslari; 2) qiyosiy korpus. Professional leksikani o‘rganishda parallel korpusning imkoniyatlari (A.A.Kokoreva)
korpusda professional yo‘naltirilgan yozma manbalar mavjud; korpusda zamonaviy professional leksika namunalarin uchratish oson.
korpusda asl manba va uning boshqa tilga tarjimasi mavjud;
korpus o‘rganilayotgan tildan ona tiliga yoki aksincha, ona tilidan o‘rganilayotgan tilga tarjima qilish ko‘nikmasini shakllantiradi;
korpusda ilmiy uslubda yaratiladigan janr namunalari to‘planadi, shu sababdan ilmiy uslubda tarjima qilish ko‘nikmasini parallel korpusdan foydalanish orqali shakllantirish mumkin;
ta’lim jarayoniga illyustrativ korpuslar jalb qilinishi (korpus maqsadiga ko‘ra tadqiqiy yoki illyustrativ bo‘ladi) lozim; chunki o‘qitilayotgan til leksikasini professional o‘rganish uchun sanoqsiz illyustrativ misollarning mavjudligi tadqiq etilayotgan masalaga oydinlik kiritadi;
Ikkinchi xildagi korpus “tarjima korpuslari” (translation corpora) ayni bir fikrning turli tildagi ifodasini o‘rganishda muhim. Ikki tilli korpus tilga oid bir qancha kuzatuv natijasini (tarjima nazariyasi tadqiqi yoki tarjima mahsulini baholashi) bera olganligi sababli tilshunoslik yo‘nalishini tanlagan talaba uchun kichik tadqiqotlar bajarishning juda foydali vositasi hamdir.
Parallel korpuslar ta’lim jarayoni uchun didaktik xususiyat va metodik funksiyasi bilan qulay ta’limiy resurs vazifasini o’tay oladi. Didaktik xususiyat sifatida (a) ko‘p tillilik, (b) qidiruv natijasining kontekst shaklidaligi, (v) tilning qo‘llanish darajasini chegaralab ko‘rsatish imkoniyatlarini ko‘rsatishi mumkin. Parallel korpusning ushbu didaktik xususiyati talabada maxsus maqsadda qilingan tarjimani o‘rgatish, so’z ma’nosini yanada yaxshiroq anglash, so’zning aniq nutqiy sharoitda qo’llanishini kuzatish asosida leksik ko’nikmani shakllantirish imkoniyatini beradi. Parallel korpus tarjima matnida sinonimik qatordagi so’zlardan qaysi birini qo’llash o’rinli ekanini aniq ko’rsata oladi. Tarjimada ma’lum bir so’zning ekvivalentini toppish, ularning sinonimlaridan birini tanlash muhim masala. Sinonimlarni qo’llashda turli tarjima matnlari kuzatiladi, sinonimik qatordagi so’zning valentlik imkoniyati, valentlikdagi chastota aniqlanadi va aniq xulosaga kelinadi. Agar bitta so’z turli tarjimada turlicha keltirilganligi korpus yordamida statistic usul bilan aniqlansa, demak, bemalol bu leksemaning lingvospetsifik xarakterli ekanligi haqida xulosa qilsak bo’ladi. 20. ПАРАЛЛЕЛ КОРПУС – 1) бир мавзуга оид икки тилдаги матнли корпус.
Биринчи типдаги корпус “параллел корпус” (parallel
corpora) деб номланиб, маълум бир таржиманинг турли
аспектини ўрганиш учун қўлланилади. Бундай корпуслар
сирасига Канада парламенти йиғини (инглиз/француз)
матнлари корпусини киритиш мумкин. Параллел корпус ўз
навбатида яна 2 турга бўлинади. Бу мосланган (aligned),
мосланмаган (not aligned) корпусдир. “Мосланган” атамаси
корпусда таржима бирликлари орасида бир-бирини тақозо
этувчи аниқ алоқа мавжудлигини билдиради. Бундай
корпусдан у ёки бу гапнинг қандай таржима қилинганини
дарров топамиз. Бу турдаги корпус таржимон учун
аҳамиятли, чунки унда ноёб ресурс - “таржима хотира”си
(translation memory) мавжуд.
2) бир-бирининг таржимаси бўлган матнли корпус.
Ko‘p tilli “moslangan” korpus namunasi sifatida Evropa Ittifoqining Acquis Communautaire ma’lumotlar bazasini keltirishimiz mumkin. Parallel korpusning qimmati uning hajmi, tillarning miqdori bilan belgilanadi. Acquis Communautaire – dunyodagi eng katta parallel korpus. Uning ikki muhim jihati korpusdan foydalanishning bepulligi, malьti-eston, sloven-fin kabi kam uchraydigan tillar juftligining mavjudligida. Bunday korpusdan quyidagi maqsadlarda foydalanish mumkin: