Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“O‘ZBEK MILLIY VA TA’LIMIY
KORPUSLARINI YARATISHNING NAZARIY
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021)
31
tajriba to‘plandi. Jahon tilshunosligida kompyuter va korpus lingvistikasi muammolarini o‘rganish XX
asrning 40-yillarida boshlanib, bu sohada dastlabki ilmiy farazlar aytildi. Xususan, o‘tgan asrning 60-
yillarida mazkur jarayon jadallashdi, XXI asr boshlarida o‘zida millionlab so‘zlarni aks ettiruvchi yuzlab
til korpuslar paydo bo‘ldi. Sun’iy intellektning avtomatik tarjima, kompyuter tahlili, tahriri, tezaurus,
elektron lug‘at singari imkoniyatlari kengaydi, ilmiy-nazariy asoslari yaratildi, amaliyotda qo‘llash
mumkin bo‘lgan ilk namunalari qo‘llanila boshladi. Fandagi bu yangilanishlar axborot texnologiyalarini
tilshunoslikka tatbiq etish bilan bog‘liq istiqbolli ilmiy yo‘nalishlar paydo bo‘lishiga yo‘l ochdi. Bu esa
korpus, korpus lingvistikasi, uning shakllanishi, taraqqiyoti, bugungi holati va korpus tuzishning umumiy
tamoyillarini o‘rganish zaruratini hamda loyihaning mavzusi dolzarbligini belgilaydi. Takomillashib
borayotgan kompyuter lingvistikasi yo‘nalishida avtomatik tarjima sifatini yaxshilash, tilni lingvistik
modellashtirish, har bir tilga oid so‘zlarni lemmalash nazariyasi, algoritmini yaratish hamda muayyan
tilning ko‘p asrlik milliy-madaniy merosdan foydalanish imkonini oshirish maqsadida ularni
elektronlashtirish jahon tilshunosligida dolzarb masalaga aylandi. Jahon tilshunosligida G.Lich
birinchilardan bo‘lib korpus lingvistikasining paydo bo‘lishi, taraqqiyoti haqida ilmiy izlanish olib bordi
[Leech: 105–122]. Zamonaviy korpus lingvistikasi shakllanishiga doir tadqiqotlar S. Hyuston, D. Biber,
S. Grays, M.Halliday va V.Teubert kabi ingliz olimlari tomonidan amalga oshirilgan [Hunston: 234]. Rus
olimlari V.Baranov va V.Zaxarov ishlarida korpus lingvistikasi spesifikasiga, N.Vladimov, S.Vadyaev,
O.Gorkina, V.Mamontova va A.Magametova kabi olimlar «korpus lingvistikasi», «lisoniy korpus»
tushunchasi va uni tasniflash muammolariga atroflicha yondashganlar [Баранов: 320]. Tojikistonlik
olima D.Dja’farova tadqiqotida korpus lingvistikasining kompyuter lingvistikasi va boshqa o‘zaro
o‘xshash sohalar bilan qiyosiy tahlili amalga oshirilgan [Джаъфарова: 151]. Korpus tahlillaridan
lug‘atshunoslikda foydalanish borasidagi ishlar A. Kilgarrif, K. Iztok, F. Karlson va I. Sojenin
tadqiqotlarida kuzatilgan bo‘lsa, V. Rыkov, A. Romanov va V. Plungyan kabi olimlar «korpus»
tushunchasini matn tahlillarida qo‘llash metodini ishlab chiqishgan [Kilgarriff, Kosem, 2012: 37] .
Tilshunoslikda, xususan, kompyuter lingvistikasi sohasida korpus yaratish, mavjud korpuslar
hajmini kengaytirish, matnni avtomatik qayta ishlaydigan dasturlarni ishlab chiqish kabilar yechimini
kutayotgan muhim masalalardan biri bo‘lib turibdi. Shubhasiz, mana shunday zaruratdan kelib chiqib
o‘zbek tilining ta’limiy korpusi, uning o‘ziga xos xususiyati, ijtimoiy, leksikologik, ta’limiy va boshqa
sohalardagi ahamiyati, korpus lingvistikasi tarixi, korpus turlari, ta’limiy korpusining lingvistik qimmatini
o‘rganish, o‘zbek tili ta’limiy korpusini yaratishning lingvistik asoslarini ishlab chiqish kechiktirib
bo‘lmaydigan muammolardan biridir.
Ta’limiy korpus shunday intensiv didaktik vositalardan biri sanaladi. O‘zbekiston Respublikasi
Prezidentining “Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universitetini tashkil
etish to‘g‘risidagi Farmoni”da: “... ona tilimizning Internet jahon axborot tarmog‘ida munosib o‘rin
egallashini ta’minlash, uning kompyuter uslubini, o‘zbek tili va dunyodagi yetakchi xorijiy tillar asosida
tarjima dasturlari va lug‘atlar, elektron darsliklar yaratish bilan bog‘liq ilmiy-metodik ishlanmalar, amaliy
tavsiyalar tayyorlash va bu borada erishilgan natijalarni amaliyotga keng tatbiq etish” vazifasi alohida
qayd etilgan. O‘zbek tilining ta’limiy korpusini yaratilishi mazkur Farmonda ko‘rsatilgan ilmiy
muammolarni hal etishga, o‘zbek tili ta’limining informatsion vositalari: korpus, uning sayti va ilovasini
yaratish, shu orqali ona tili yoki xorijliklar uchun o‘zbek tilini o‘rganishning yangi imkoniyatini yaratadi.
O‘zbek tilining ta’limiy korpusi ona tili ta’limida zarur bo‘ladigan lug‘at, audio, video hamda didaktik
materiallarni o‘z ichiga olgan axborot-ta’limiy baza bo‘la oladi. Ushbu korpus ona tilining
imkoniyatlarini yanada kengroq ochish, go‘zal va betakror tilimizni o‘rganishga yordam beradi.
O‘zbek tilining ta’limiy korpusi axborot manbayi sifatida quyidagi qulayliklarni yaratadi:
1)
ta’limiy korpusda yaratilgan og‘zaki, yozma yodgorliklar, milliy, madaniy meros namunalari elektron
ko‘rinishda internet tarmog‘idan joy oladi;
2)
o‘zbek tilining ta’limiy korpusi tabiiy (real) tilning elektron shakldagi, qidiruv dasturiga
joylashtirilgan matnlar yig‘indisi; bir marta tuzilib, mukammal teglangan korpus lingvistik tadqiqotlar
samaradorligini ta’minlashda barqaror lingvistik baza vazifasini bajaradi;
3)
ta’limiy korpus elektron kutubxona, lug‘at, grammatikalar yaratishga asos bo‘ladi. U keng ko‘lamli
bo‘lganligi uchun ma’lumotning o‘ziga xosligini kafolatlab, til hodisalarining barcha qirralarini to‘liq
namoyish etishni ta’minlaydi;
Do'stlaringiz bilan baham: |