Keywords: Turkology, corpus annotation, linguistic resource, Uzbek corpus 1. Kirish XXI asrning eng dolzarb ijtimoiy muammolaridan biri tabiiy tillarni saqlab qolishdir. Dunyo
tillarining elektron korpuslarini yaratish va rivojlantirishda NLP va til texnologiyalariga doir
tadqiqotlarni izchil ravishda olib boorish dolzarb vazifaga aylandi. Ayniqsa, turkiy tillarning lingvistik
resurslar bazasini yaratishda standart modellarga asoslanish va ular bo‘yicha dasturiy ta’minotlarni
yaratish muhim sanaladi. Ayni vaqtda til industriyasiga bo‘lgan e’tibor va qiziqish ortib bormoqda. Xavf
ostida qolayotgan tillarni saqlab qolish va ularning rivoji uchun xalqaro darajadagi turli tashkilotlar va
jamg‘armalar orqali qo‘llab- quvvatlanib kelinmoqda. Tillarning elektron bazasini yaratish ularni millat
tili sifatida saqlab qolish uchun asosiy omillardan biri sifatida ta’kidlanmoqda. Ta’kidlash lozimki, kam
ta’minli electron resursli hamda xavf ostidagi tillar sirasiga turkiy tillar guruhiga kiruvchi til oilalarning
ham borligi soha vakillari tomonidan qayd etildi [UNESCO LT4All 2019, TurkLang 2020].
Til hamisha kishilik jamiyatning eng ajralmas aloqa vositasi bo‘lib xizmat qiladi. Uning
yordamida yangi bilimga erishiladi va egallangan bilim tafakkur va tajriba asosida qayta ishlanadi.
Bugun til sanoatida kompyuter lingvistikasi, mashina tarjimasi, til texnologiyasi, tabiiy tilni qayta
ishlash, sun'iy intellekt texnologiyasi kabi terminlar tez-tez qo‘llanilib kelinmoqda. Bularning har biri
insoniyat tomonidan yaratilgan lingvistik resurs orqali o‘z tadrijiy takomiliga ega [Abduraxmonova
N., 2020: 51].
Shunisi quvonarliki, turkiy tillarning alohida elektron korpuslari allaqachon yaratib bo‘lingan.
Quyida ana shunday korpuslarning ayrimlarini eslatib o‘tmoqchimiz: turk tilining milliy korpusi (TNC) -
www.tnc.org.tr ; qozoq tilining Almaty Corpus (NCKL) - veb - corpora.net/KazakhCorpus; oltoy
tilining korpusi - altay2.gasu.ru; boshqird tilining milliy korpusi - bashcorpus.ru ; boshqird tilining poetik
korpusi - web-corpora.net/bashcorpus ; tatar tilining milliy «Tugan Tel»- tugantel.tatar ; tatar tilining
yozma matnlar korpusi - www.corpus.tatar ; o‘zbek tilining elektron korpusi
http://uzbekcorpus.uz/
hamda
https://corpus-uz.herokuapp.com/
; xakas tili korpusi - khakas.altaica.ru; yoqut tilining korpusi -
28
* Qozon Federal universiteti, Amaliy Semiotika instituti katta ilmiy xodimi, texnika fanlari nomzodi, dotsent
29
* Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti dotsenti, filologiya fanlari
bo‘yicha falsafa doktori (PhD), abdurahmonova.1987@mail.ru