KORPUS – MATNLARNI QAYTA ISHLASHNING ZAMONAVIY VOSITASI SIFATIDA CORPUS – A MODERN MEANS OF TEXT PROCESSING Mahmud Panji o‘g‘li Rajabov *
62
Annotatsiya: Maqolada korpus lingvistikasining nazariy asoslari, maqsadi, predmeti va vazifalari haqida so‘z boradi. Ko‘pgina sohaga oid atamalarga izoh beriladi. Korpus yaratish bosqichlari, shakllantirilish jarayoni nazariy asoslanadi. Shuningdek, korpus lingvistikasi tarixiga oid ma’lumotlar beriladi. Kalit so‘zlar: korpus tilshunosligi, morfologik tahlil, morfologik, semantik, anaforik va prosodik belgilar. Annotation: The article deals with the theoretical foundations, goals, subject and objectives of corpus linguistics. Many industry terms are explained. The stages of corpus formation, the process of formation are theoretically based. It also provides information on the history of corpus linguistics. Keywords: corpus linguistics, morphological signs, morphological analysis, semantic designation, anaphoric signs, prosodic signs. Korpus tilshunosligi – kompyuter texnologiyasidan foydalangan holda lingvistik korpuslarni (matn
korpuslarini) qurish va ulardan foydalanishning umumiy tamoyillarini ishlab chiqadigan hisoblash
lingvistikasining bir bo‘limi. Tilshunoslik yoki lingvistik nom ostida matnlar korpusi deganda ma’lum bir
lingvistik muammolarni hal qilish uchun mo‘ljallangan, elektron shaklda taqdim etilgan, birlashtirilgan,
tuzilgan, belgilangan, filologik jihatdan vakolatli qator ma’lumotlar to‘plami tushuniladi. “Matn korpusi”
tushunchasi matn va lingvistik ma’lumotlarni boshqarish tizimini ham o‘z ichiga oladi, uni yaqinda
korpus menejeri (yoki korpus menejeri) deb atashadi. Bu korpusdagi ma’lumotlarni qidirish, statistik
ma’lumotlarni olish va natijalarni foydalanuvchiga qulay shaklda taqdim etish uchun dasturiy vositalarni
o‘z ichiga olgan ixtisoslashgan qidiruv tizimi.
Korpuslarni yaratishning maqsadga muvofiqligi va ulardan foydalanish mazmuni quyidagi zarur
shartlar bilan belgilanadi:
1.
korpusning yetarlicha katta (vakili) hajmi ma’lumotlarning tipikligini kafolatlaydi va
lingvistik hodisalarning butun spektrini taqdim etishning to‘liqligini ta’minlaydi;
2.
har xil turdagi ma’lumotlar korpusda tabiiy kontekst shaklida bo‘ladi, bu ularni har
tomonlama va ob'ektiv o‘rganish imkoniyatini yaratadi;
3.
ma’lumotlar to‘plamini yaratgandan va tayyorlaganidan so‘ng, ko‘plab tadqiqotchilar
tomonidan va turli maqsadlarda bir necha marta foydalanish mumkin.
Biz aytishimiz mumkinki, barcha zamonaviy lingvistik tadqiqotlar va lug‘atlar va grammatikalarni
tuzish bo‘yicha ishlar u yoki bu tarzda vakillik matn korporatsiyalaridan foydalanishga qaratilgan. Tabiiy
tilda matnlarni qayta ishlash uchun zamonaviy intellektual dasturiy ta’minot tizimini yaratish ham katta
eksperimental lingvistik bazani talab qiladi. Korpus ma’lumotlariga bo‘lgan talab tegishli texnik
imkoniyatlarning paydo bo‘lishiga to‘g‘ri keldi. Birinchi lingvistik matn korpuslari 60-yillarda paydo
bo‘lgan. 1963-yilda Braun Universitetida (AQSh) birinchi marta mashina muhiti (Brown Corpus)
bo‘yicha katta korpus yaratildi. Korpus mualliflari V. Frensis va H. Kucera uni besh yuz ikki ming
so‘zdan iborat ingliz tilidagi bosma nasr to‘plami sifatida ishlab chiqdilar. Matnlar Qo‘shma Shtatlarda
ingliz tilidagi bosma nasrning eng mashhur o‘n besh janriga mansub bo‘lib, 1961-yilda nashr etilgan.
Korpusga dastlabki statistik ishlov berish uchun juda ko‘p materiallar – chastota va alfavit-chastota
lug‘ati, turli xil ma’lumotlar qo‘shilgan. statistik taqsimotlar. Jigarrang korpusning paydo bo‘lishi
umumiy qiziqish va qizg‘in munozaralarni uyg‘otdi. Avvalo, ular matnlarni tanlash prinsiplari va bunday
korpusda hal qilinishi mumkin bo‘lgan vazifalar tarkibi haqida to‘xtalib o‘tdilar. Undan keyin Lancaster-
Oslo-Bergen korpusi (LOB), Uppsala rus korpusi. Ingliz tilining zamonaviy korpuslari orasida eng
mashhurlari British National Corpus, International Corpus of English, Ingliz tili lingvistik banki va
boshqalar). Rus tilining milliy korpusini yaratish bo‘yicha ishlar olib borilmoqda.
62
*
62
* ToshDO‘TAU O‘zbek tili va adabiyotini o‘qitish fakulteti 3-kurs talabasi