Jahon va oʻzbek tilshunosligida korpus lingvistikasining tadrijiy taraqqiyoti
Progressive development of corporate linguistics in world and uzbek linguistics
Eshmuminov Asqar Allamurodovich
*
*
Annotation.
The article puts forward the views on the Corpus, the history of Corpus
linguistics, the creation of linguistic corpora.
Key words:
Corpus, corpus linguistics, corpus types, problems of creating a national
corpus of Uzbek language
Korpus lingvistikasi kompyuter lingvistikasining mustaqil boʻlimi, lingvistik korpuslar
(matn korpuslari)ni tuzish va undan foydalanish tamoyillarini kompyuter texnologiyalarini
qoʻllagan holda ishlab chiqish bilan shugʻullanadi. U XX asr 90-yillarining oʻrtalaridan
*
*
filologiya fanlari bo‘yicha falsafa doktori, TerDU O‘zbek tili va adabiyoti kafedrasi mudiri,
easqar@list.ru
389
tilshunoslikning alohida sohasi sifatida rivojlana boshladi. Korpus borasida fanda oʻziga xos
ilmiy qaydlar mavjud. Ya’ni uni ilmiy apparat bilan ta’minlangan matnlarning elektron
jamlanmasi sifatida tushunish, shuningdek, “matn korpusi” tushunchasi ostida shakllanayotgan
korpus lingvistikasiga ishora berish; “ijtimoiy-gumanitar izlanishlarga moʻljallangan, oʻz
qurilishi va razmetkasiga ega boʻlgan elektron shakldagi lisoniy ma’lumotlar koʻlami”, “nutqiy
faoliyatning murakkab qurilishga ega boʻlgan ontologiyasi” tarzida anglash kuzatiladi.
Murakkab lisoniy butunlik sifatida korpus oʻzida nutqiy/lisoniy manbaning tarkibiga doir keng
hajmli axborotni saqlabgina qolmay, shu axborotni taqdim etishning formal usullari (soʻzlarni
indeksatsiyalash, morfologik ma’lumot va b. singarilar) ni ham jamlaydi. Shunga mos tarzda,
korpusni maxsus qurilgan semiotik tizim qabilida sharhlash ham mumkin.
Korpus lingvistikasi matn korpuslari tahlili bilan shugʻullanuvchi fan sifatida Gʻarbiy
Yevropa va AQShda 1960-yillar oxirida vujudga keldi. Kompyuter va axborot-kommunikativ
texnologiyalarining shiddatli rivoji natijasida 1980-yillar oʻrtalarida turli til va hajmdagi korpus
loyihalari yaratildi. Bu davrda korpus lingvistikasida erishilgan natijalar til oʻqitish jarayoniga
keng tatbiq etila boshlandi, jahonning yetakchi oliy ta’lim muassasalarida korpus lingvistikasi
boʻyicha yaratilgan loyihalar amaliyot va kun mavzusiga aylana bordi. Bu orqali korpus
yondashuvning tarixiy, geografik, ijtimoiy variatsiyasi va uning lisoniy tizimdagi oʻzgaruvchan
shakllarini namoyon etuvchi optimal tabiati ochila bordi. Bu, oʻz navbatida, lingvistik tahlilning
korpusga asoslangan usullarga doir asosiy tamoyillarni oʻzlashtirish imkonini yaratdi.
Korpus lingvistikasining rivoji, korpuslarning yaratilish masalasi oʻz kelajak taqdiriga
qaygʻuradigan millatlar uchun dolzarb masalalardan biri. XX asrning birinchi yarmida milliy
korpusni faqat qoʻlbola usulda tuzish imkoni mavjud edi. Bu esa uzoq muddat va koʻp xarajat
talab qilardi. Shu sababli matn korpuslarini yaratishga u qadar roʻyxushlik bilan yondashilmas,
unga qoʻl urilishi ham koʻpchilik tomondan bildirilgan qiziqish evaziga sodir boʻlardi. Yuqorida
ta’kidlangani kabi, axborot-kommunikativ texnologiyalar taraqqiyoti bilan korpusga aloqador
materiallarni sinxronlashtirish va tizimga solish ishlari osonlashdi, xarajatlar ham shunga koʻra
kamaydi.
Korpus lingvistikasining rivoji jamiyatga mislsiz foydani va’da qiladi: holbuki, unda
gumanitar va texnika fanlariga oid koʻplab ijobiy jihatlar oʻzaro birlashadi. Biroq yaqin yillarda
shakllangan fan sifatida korpus lingvistikasi hali toʻlaqonli mustaqillikka erishgan,
takomillashgan fan hisoblanmaydi. Chunonchi, qator olimlar korpus lingvistikasini an’anaviy
tilshunoslikning sohasi sifatida sharhlaydilar va tushunadilar. Bunda ular korpus lingvistikasini
nazariy asosdan xoli, faqat amaliy jihatlardan tarkib topgan fan, deya izohlaydilar. Ularning
fikricha, korpus materialni qayta ishlashning optimal usuli, yangi informatsion resurs.
Vaholanki, tilshunoslikning amaliyot bilan bogʻlangan har qanday sohasi oʻz predmeti, usuli va
nazariyasiga ega fan sifatida mavjud boʻla oladi, busiz korpus lingvistikasining terminologik
apparati shakllanmasdi ham.
Aslida, korpus lingvistikasining vujudga kelishida XIX asr oʻrtalaridagi lingvistikaga
boʻlgan ratsional (toʻgʻri va notoʻgʻri konstruksiyalarni farqlashga xizmat qiluvchi lingvistik
ichki hissiyotga asoslanadi) va uning ketidan empirik (kommunikatsiya uchun qulayliklar
majmuasini taqdim etuvchi resurs – zaхira) yondashuvning ta’siri bor. Bugungi kunda korpusni
tuzishda qoʻllanadigan texnologiyalarning dastlabki koʻrinishlari hali kompyuterlar kashf
qilinmagan davrda – XVIII – XIX asrlarda yaratilgan. Tilni qiyosiy-tarixiy tilshunoslik nuqtai
nazaridan tekshiruvchilar tomonidan ulkan miqdordagi matnlarni bobo tilga chiqib borish
maqsadida oʻrganish ham korpus lingvistikasining ildizlari sifatida baholanadi. Korpus
lingvistikasining rivojiga xizmat qilgan bosqichlarning yana biri – sotsiolingvistik tadqiqotlardir.
Negaki, XIX asrdayoq olimlar dialektlarning xaritalarini tuzish asnosida dialektlararo
munosabatlar toʻplamini yarata boshladilar. Binobarin, bu ishda korpusga tegishli dastlabki
tamoyillarning qoʻllanilgani, shubhasiz.
390
Bugungi kunda esa korpus lingvistikasining bor shiddat bilan taraqqiy etishiga toʻsiqlar
deyarli mavjud emas, deb hisoblasa boʻladi: butunjahon internet tizimining rivoj topishida
korpusga aloqador hajm va koʻlam masalalari oʻz-oʻzidan barham topa bordi. Shuningdek,
Shimoliy va Gʻarbiy Amerikadagi axborot texnologiyalarining rivoj topishi, oʻz navbatida, XX
asr 60-80 yillar Britaniya korpus lingvistikasining istiqbollariga keng yoʻl ochdi.
Umuman, XX asrda rivoj topgan korpuslarning xossalarini quyidagi jadval orqali
koʻrsatish mumkin. Bundan tashqari, Britaniya milliy korpusidan ilhomlanib yaratilgan rus
milliy korpusi ham oʻz ichiga 163 mln. (bugungacha esa 500 mln.) tarixiy va zamonaviy
qatlamga tegishli soʻzlarni kiritganligi bilan mashhur.
Do'stlaringiz bilan baham: |