Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti


KORPUS – MATNLARNI QAYTA ISHLASHNING ZAMONAVIY VOSITASI SIFATIDA



Download 7,21 Mb.
Pdf ko'rish
bet176/398
Sana26.02.2022
Hajmi7,21 Mb.
#467559
1   ...   172   173   174   175   176   177   178   179   ...   398
Bog'liq
Тайёр Миллий корпус тўплам 17.05

KORPUS – MATNLARNI QAYTA ISHLASHNING ZAMONAVIY VOSITASI SIFATIDA 
 
CORPUS – A MODERN MEANS OF TEXT PROCESSING 
 
Mahmud Panji o‘g‘li Rajabov
*
62
Annotatsiya: 
Maqolada korpus lingvistikasining nazariy asoslari, maqsadi, predmeti va vazifalari 
haqida so‘z boradi. Ko‘pgina sohaga oid atamalarga izoh beriladi. Korpus yaratish bosqichlari, 
shakllantirilish jarayoni nazariy asoslanadi. Shuningdek, korpus lingvistikasi tarixiga oid ma’lumotlar 
beriladi.
Kalit so‘zlar:
korpus tilshunosligi, morfologik tahlil, morfologik, semantik, anaforik va prosodik 
belgilar. 
Annotation: 
The article deals with the theoretical foundations, goals, subject and objectives of 
corpus linguistics. Many industry terms are explained. The stages of corpus formation, the process of 
formation are theoretically based. It also provides information on the history of corpus linguistics. 
Keywords:
corpus linguistics, morphological signs, morphological analysis, semantic designation, 
anaphoric signs, prosodic signs. 
Korpus tilshunosligi – kompyuter texnologiyasidan foydalangan holda lingvistik korpuslarni (matn 
korpuslarini) qurish va ulardan foydalanishning umumiy tamoyillarini ishlab chiqadigan hisoblash 
lingvistikasining bir bo‘limi. Tilshunoslik yoki lingvistik nom ostida matnlar korpusi deganda ma’lum bir 
lingvistik muammolarni hal qilish uchun mo‘ljallangan, elektron shaklda taqdim etilgan, birlashtirilgan, 
tuzilgan, belgilangan, filologik jihatdan vakolatli qator ma’lumotlar to‘plami tushuniladi. “Matn korpusi” 
tushunchasi matn va lingvistik ma’lumotlarni boshqarish tizimini ham o‘z ichiga oladi, uni yaqinda 
korpus menejeri (yoki korpus menejeri) deb atashadi. Bu korpusdagi ma’lumotlarni qidirish, statistik 
ma’lumotlarni olish va natijalarni foydalanuvchiga qulay shaklda taqdim etish uchun dasturiy vositalarni 
o‘z ichiga olgan ixtisoslashgan qidiruv tizimi. 
Korpuslarni yaratishning maqsadga muvofiqligi va ulardan foydalanish mazmuni quyidagi zarur 
shartlar bilan belgilanadi: 
1.
korpusning yetarlicha katta (vakili) hajmi ma’lumotlarning tipikligini kafolatlaydi va 
lingvistik hodisalarning butun spektrini taqdim etishning to‘liqligini ta’minlaydi; 
2.
har xil turdagi ma’lumotlar korpusda tabiiy kontekst shaklida bo‘ladi, bu ularni har 
tomonlama va ob'ektiv o‘rganish imkoniyatini yaratadi; 
3.
ma’lumotlar to‘plamini yaratgandan va tayyorlaganidan so‘ng, ko‘plab tadqiqotchilar 
tomonidan va turli maqsadlarda bir necha marta foydalanish mumkin. 
Biz aytishimiz mumkinki, barcha zamonaviy lingvistik tadqiqotlar va lug‘atlar va grammatikalarni 
tuzish bo‘yicha ishlar u yoki bu tarzda vakillik matn korporatsiyalaridan foydalanishga qaratilgan. Tabiiy 
tilda matnlarni qayta ishlash uchun zamonaviy intellektual dasturiy ta’minot tizimini yaratish ham katta 
eksperimental lingvistik bazani talab qiladi. Korpus ma’lumotlariga bo‘lgan talab tegishli texnik 
imkoniyatlarning paydo bo‘lishiga to‘g‘ri keldi. Birinchi lingvistik matn korpuslari 60-yillarda paydo 
bo‘lgan. 1963-yilda Braun Universitetida (AQSh) birinchi marta mashina muhiti (Brown Corpus) 
bo‘yicha katta korpus yaratildi. Korpus mualliflari V. Frensis va H. Kucera uni besh yuz ikki ming 
so‘zdan iborat ingliz tilidagi bosma nasr to‘plami sifatida ishlab chiqdilar. Matnlar Qo‘shma Shtatlarda 
ingliz tilidagi bosma nasrning eng mashhur o‘n besh janriga mansub bo‘lib, 1961-yilda nashr etilgan. 
Korpusga dastlabki statistik ishlov berish uchun juda ko‘p materiallar – chastota va alfavit-chastota 
lug‘ati, turli xil ma’lumotlar qo‘shilgan. statistik taqsimotlar. Jigarrang korpusning paydo bo‘lishi 
umumiy qiziqish va qizg‘in munozaralarni uyg‘otdi. Avvalo, ular matnlarni tanlash prinsiplari va bunday 
korpusda hal qilinishi mumkin bo‘lgan vazifalar tarkibi haqida to‘xtalib o‘tdilar. Undan keyin Lancaster-
Oslo-Bergen korpusi (LOB), Uppsala rus korpusi. Ingliz tilining zamonaviy korpuslari orasida eng 
mashhurlari British National Corpus, International Corpus of English, Ingliz tili lingvistik banki va 
boshqalar). Rus tilining milliy korpusini yaratish bo‘yicha ishlar olib borilmoqda. 
62
*
62
* ToshDO‘TAU O‘zbek tili va adabiyotini o‘qitish fakulteti 3-kurs talabasi 



Download 7,21 Mb.

Do'stlaringiz bilan baham:
1   ...   172   173   174   175   176   177   178   179   ...   398




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish