Milliy korpusning asosiy mijozlari - foydalanuvchilari kim?
a) turli mutaxassisliklar bo‘yicha tadqiqotchilar, birinchi navbatda, lingvistika bo‘yicha mutaxassislar, ijtimoiy soha vakillari, psixolingvistlar, tilshunoslik sohasiga qiziquvchilar va h.;
b) adabiyotshunoslar, tarixchilar, jurnalistlar, siyosatshunoslar, sotsiologlar, ya’ni gumanitar ta’limning deyarli barcha vakillari.
II BOB. LINGVISTIK KORPUS TUZISHNING UMUMIY TAMOYILLARI VA MA’LUMOTLARNI TAYYORLASH TEXNOLOGIYASI
2.1. Lingvistik korpus tuzishning umumiy qoidalari
Hozirgi jamiyatda insonlar o‘rtasidagi muloqot jarayonlari yanada murakkablashib, mukammallashib bormoqda. Kompyuter paydo bo‘lishi bilan muloqotning internet shakli yuzaga kelishi kishilik jamiyati uchun qay darajada qulayliklarni yaratayotgan bo‘lsa, o‘zgarayotgan sharoitlarda inson dunyoni tabiiy qabul qilish ko‘nikmasini yo‘qotmasligi va ona tilini o‘z milliy-madaniy an’analari doirasida saqlab qolishi zarurligini taqozo qilmoqda. Zero, ulkan matn ma’lumotlarini tezkor qayta ishlash imkoniga ega bo‘lgan texnikaning paydo bo‘lishi olam lisoniy manzarasini virtual olamga ko‘chirmoqda.
Kompyuter texnologiyalari vositasida axborotni qayta ishlash, mashina tarjimasi, elektron lug‘atshunoslikni rivojlantirish, tezauruslar tuzish, til korpusini yaratish ishlari dunyo lingvistikasida gegemonlikka erishgan tillar allaqachon amalga oshirganligini ta’kidlagan edik. Ingliz, rus, arab, fransuz, nemis, ispan, tojik kabi tillar shular jumlasidandir. Keyinchalik boshqa tillarda ham milliy til korpuslari yaratildi. Mazkur tillarda til korpusini yaratish masalasining ilmiy-nazariy jihatlari allaqachon mavjudligi o‘zbek tilini ham internet “tushunadigan” tilga aylantirish (ya’ni milliy til korpusini yaratish) sa’y-harakatlarini jadallashtirish zaruratini ko‘rsatdi. Zero, o‘zbek tili dunyoning eng boy va ko‘p sonli aholi gaplashuvchi tillaridan biri hisoblanadi.
Bu borada tilshunos olimlar tilni va u bilan bog‘liq bo‘lgan hamda ilgari ma’lum bo‘lmagan sohalarni o‘rganishda juda muhim tadqiqot imkoniyatiga ega bo‘ldilar26. Tilni o‘rganishda tilshunoslar nutq faoliyatini ancha to‘liq aks ettiradigan qulay va ixcham nutq materialiga ehtiyoj sezadi. Bu ehtiyoj esa elektron shaklda taqdim etilgan matnlarni, ya’ni lingvistik korpuslarni yaratishni taqozo qiladi. Lingvistik korpuslar o‘zida til tizimining tilshunoslik izohlarini va boshqa tilshunoslik fanlarida qo‘llanilishi mumkin bo‘lgan matnlarni korpusda o‘ziga xos aks etadigan nutq materiali sifatida tadqiq etadi. An’anaviy tilshunoslikdan farqli ravishda korpus tilshunosligi til yoki nutq hodisalarini o‘rganish bilan shug‘ullanmaydi, balki nutqning korpusda maxsus tanlangan matnlari barcha ko‘rinishlarini (badiiy, ilmiy, muomala tilini) o‘rganadi. Bu o‘rinda mantiqiy fikrlash va an’anaviy tilshunoslik deduksiyasiga nisbatan ehtimollik, statistik va induktiv usullar tez qo‘llaniladi. Bunda uzoq yillar davomida yig‘ilgan tajribalar asosida olingan natijalarga, baholarga va amallarga emas, balki empirik jihatdan to‘plangan materiallarga ko‘proq tayanildi. Korpus tilshunosligi uchun asosiy vosita bir yoki bir necha tillar doirasidagi nutq faoliyati hamda korpusdagi keyingi tadqiqotlarni ixchamlashtirish uchun zarur bo‘lgan korpus materiallarini kodlashtirish hisoblanadi. Quyidagi xususiyatlar korpus uchun muhim omil sanaladi: to‘plangan materiallarni mashina (kompyuterlar) xotirasiga joylashtirish; elektron qidiruvga (morfologik, sintaktik qidiruvlar) imkon beradigan o‘ziga xos belgi; yakuniy o‘lchov birligiga ega va reprezentativlik (tildagi ko‘plab janrlarning asl holida to‘liq aks etishi) xususiyatlari kabi.
O‘zbek tili milliy korpusi – o‘zbek tilining badiiy asarlari hamda variantlari, keng ko‘lamli lingvistik va metamatnli ma’lumotlari bilan ta’minlangan, turli xil uslublarni aks ettiruvchi elektron matnlar majmuasini ifodalay olishi kerak.
Bunday ma’lumotlar mavjudligi korpusning asosiy xususiyatlaridan biri bo‘lib, uni elektron shakldagi hammabop oddiy matnlar majmuidan, xususan, odatdagi internetdan farqli o‘laroq ajralib turadi. Ma’lumotning mukammalligi va aniqliligi, shuningdek, turli xildagi tilga oid fakt va hodisalarning batafsil qamrab olinishi korpusning ko‘p qirrali lingvistik manba sifatidagi asosiy ahamiyatini ko‘rsatadi. Korpus asosan ikki turdagi ma’lumotga ega bo‘ladi:
Do'stlaringiz bilan baham: |