Milliy korpus yaratishning zaruratlari nimada? Yevropa va rus tilshunosligida shu sohasida qilinadigan va qilinayotgan barcha tadqiqotlar korpusga asoslanadi. Statistik tadqiq metodi kompyuter tarjimasi, nutqni sintezlash va uni tanish, aniqlash, orfografik tekshiruv kabi lingvistik amallarni bajarishish korpus lingvistikasining keyingi taraqqiyot bosqichida amalga oshiriladi.
Kompyuter lingvistikasi sohasi olib borilayotgan tadqiqotlarda ham korpusning ahamiyati haqida fikr yuritilgan21. Hozirda tadqiqotchi qanchalar lug‘atga tayanib qolgan bo‘lsa, yaqin kelajakda izlanuvchilar xuddi shunday korpusga bog‘linib qolishlari, shubhasiz. Hech qanday vosita korpusdek, operativ (tezkorlik bilan) so‘zning qo‘llanish davri va chastotasini aniqlashda tenglasha olmaydi. Bu jarayon lug‘at tuzish boshlanishidan tugash jarayonigacha (nashrgacha) tilni aks ettirib turadi, lug‘at qismi «eskirish»ga ulgurmaydi. Korpusga tayanib misol tanlash an’anaviy yo‘l bilan tanlashdan ko‘ra ishonarliligini ta’minlaydi. Shuning uchun ham til korpusi gap qurilishini o‘rganishda muhim ahamiyati ega. Ta’lim olish samaradorligini oshirish uchun yangi imkoniyatlar eshigini ochib beradi. Lingvodidaktika sifatida til korpusi ona tili va xorijiy tilni o‘rganishda birdek ahamiyatlidir. Tilni o‘rgatishda, so‘zning qo‘llanish imkoniyatini u yoki bu grammatik qurilish orqali tushuntirish uchun misollar maydonini tanlashda korpus juda qo‘l keladi. Ta’lim jarayonida misolning doimiy yangilanib borishi, buni o‘zida aks ettirib turish xususiyati hamda imkoniyati faqat korpusga xos xususiyatdir. Ta’lim beruvchi shaxs yangi, ishonarli, cheksiz, xilma-xil misollarni korpusdan topa oladi. Shu joyning o‘zida yangi topshiriq va mashqlarni yaratadi. Bir necha daqiqada mavzu bo‘yicha yangi misollardan iborat keyslarni tayyorlay oladi. Chunonchi, yo‘nalishlarning mavzusi bir xil bo‘lishi mumkin, lekin har bir mutaxassislikka oid mavzuni tushuntirish uchun mos matnni tanlashda korpusdagidek imkoniyat boshqa manbada yo‘q. Masalan, so‘zning shakl va ma’no munosabatiga ko‘ra turi turli yo‘nalishlarda alohida ixtisoslashtirilgan matnlar asosida o‘rganiladi. Shundagina til ta’limi o‘z maqsadiga erishgan bo‘ladi.
O‘qituvchi uchun korpus tengsiz xazina, undan har bir o‘quv mashg‘uloti uchun serqirra va mazmunli o‘quv materiali tayyorlash mumkin. Yuqorida aytib o‘tganimizdek, korpusda xilma-xil matnlar jamlanadi, undan o‘qituvchi istalgan shaklda foydalana oladi. Masalan, “ona tili va adabiyoti” fani o‘qituvchisi darsga tayyorgarlik jarayonida badiiy matndan yoki ma’lum ijodkor ijodi bilan bog‘liq topshiriqlarni tayyorlaydi. Bunda “Mening korpusim” deb nomlangan oyna orqali o‘qituvchi o‘ziga matnni ko‘chirib (ajratib) oladi. O‘qituvchi yoki tadqiqotchining har qanday talabi qondirilishining yagona sababi: korpusda turli xil janrdagi(epik, lirik, liroepik) va uslubdagi (publitsistik, badiiy, so‘zlashuv) matnlar mavjudligidir. Til korpusi orqali so‘z, so‘z birikma yoki gap( ibora bo‘lishi mumkin) ni topish yoki uning qo‘llanishi, yozilishi (orfografiyasi) bilan bog‘liq muammo juda qisqa muddat ichida hal etiladi. Shuni ta’kidlab o‘tish joizki, til korpusidagi ma’lumotlar grammatika yoki darslikda tavsiflanganidek emas, balki hayotda, jamiyatda qanday aks etsa, nutqda yashasa, shu holatida: nutq jarayonidan olingan parchada beriladi. U adabiy tilni o‘rganishda sermahsul vosita sifatida xizmat qiladi.
Ta’limni bugungi hayotga yaqinlashtirib turuvchi narsa: muntazam to‘ldirilib boriladigan korpusdan yangi misollarni olish, uni tadqiqotchiga taqdim etish hisoblanadi. Qayta-qayta nashr etilgan darsliklarda misollar yangilanmanganligi bois, bunday kitoblardan zaruriy bilimni davr bilan hamohang o‘zlashtirishga imkon bo‘lmaydi. XX asr boshi yoki o‘rtasida yozilgan asar bilan ishlash jarayoni unga hozirgi adabiy til uslubini shakllantirish uchun yetarli emas. Bugun grammatika bilan shug‘ullanuvchi olimdan ko‘ra oddiy tadqiqotchi ma’lum bir so‘z, ibora yoki konstruksiyaning qo‘llanilish holati, darajasi, kim, qachon ilk marta bu tuzilmani qo‘llaganligi, qanday uslub uchun xoslanishini bilishga ko‘proq ehtiyoj sezadi. Korpus esa mana shu kabi muammolarni hal qilishga yo‘naltirilgandir.
Korpus – tilni tadqiq etishda (so‘zning o‘zgarishi, tarixiy so‘zlar, neologizm vujudga kelishi, ma’no kengayishi, torayishi; yangi frazeologizmlar paydo bo‘lishini kuzatish), tilni o‘rganishda, lug‘at tuzishda keng imkoniyatga ega va o‘ta zamonaviy dasturlangan tizim bo‘lganligi bois internet tarmog‘idan joy oladi hamda mutaxassislar tomonidan doimiy ravishda to‘ldirilib boriladiki, uning lingvistik bazasi eskirishga ulgurmaydi.
Kompyuter lingvistikasi bo‘yicha o‘tgan qisqa davrda muayyan natijalarga erishildi. Ammo hal etilishi lozim bo‘lgan muammolar anchagina. Masalan, o‘zbek tilining morfologiyasi va unga qo‘shilishi mumkin bo‘lgan qo‘shimchalar bazasi yaratilishi kerak. Tahrirlovchi dastur uchun esa imloviy, balki sintaktik va uslubiy jihatlarini inobatga olish zarur. S. Muhammedova va N. Abdurahmonova tomonidan quyidagi ishlar amalga oshirilmoqda: “matn muharrirlarida o‘zbek tilida yozilgan matnlarning imlo xatolarini o‘zbek alifbosiga asoslangan klaviatura orqali bartaraf etish yo‘llari ham ishlab chiqildi. Buning uchun harflarni tamomila lotin alifbosiga o‘tkazadigan UNICODE dasturidan biriktirilgan kodni olish va istiqbolda ushbu harflarni Microsoft Office dasturiga kiritish ko‘zda tutilgan. O‘zbek tili grammatikasi va uning axborot uslubini yaratish borasida jiddiy ishlar amalga oshirilishi zarurki, unga ko‘ra, davlat tilida ish yuritish va muayyan sohada qo‘llaniladigan atamalarning o‘zbekcha muqobil variantlarini lug‘atlarda shakllantirish, ularga yo‘riqnoma, mobil ilovalar yaratish, shuningdek, internet tizimi, OAV, reklama agentliklari mahsulotlariga qo‘yiladigan belgilarda qat’iy mezonni belgilash fan oldida turgan muhim vazifalardandir”22.
S. Muhammedova va N. Abdurahmonova tomonidan “O‘zbek tilining dasturiy ta’minoti” laboratoriyasida ovozli lug‘atlar yaratish borasida sa’y-harakatlar boshlangan, chunonchi, “Kelajakda nutqiy sintezatorni yaratish uchun matnlarni ovozli dasturlarga o‘tkazish yoki, aksincha, ovozli axborotlarni matnga o‘tkazuvchi dasturlar yaratish borasida ham izlanishlar olib borilyapti. O‘zbek tilini dunyoga targ‘ib etishda uning MOOC (massive open online course) tizimini yaratish juda muhim bo‘lgani bois, o‘zbek tilini o‘qitishning elektron darsliklari va videokurslar ham yaratilmoqda. Shunga ko‘ra, o‘zbek tilini bilish darajasini tekshiruvchi maxsus dastur, ya’ni o‘zbek tilini o‘rgatish bo‘yicha masofaviy ta’lim yo‘lga qo‘yilmoqda. O‘zbek tilining tezaurusi, ontologiyasi va matn korpuslarini yaratish ham xuddi shunday eng muhim masalalardan bir sanaladi” 23.
Do'stlaringiz bilan baham: |