Кириш
Истиқлол
йилларида компьютер лингвистикасида автоматик таржима, сунъий
интеллектнинг ўзбек тилини тушуниш ва қайта ишлашига эришиш борасида қатор тадқиқотлар
амалга оширилган бўлса ҳам, тил корпуслари тузиш тажрибаси амалиётга жорий қилинмаган эди.
Кейинги йилларда ўзбек тили корпуслари, уларнинг хусусияти, турлари, муаллифлик корпусини
тузиш тамойиллари [Хамроева, 2018], ўзбек тили бирликларини графематик таҳлил қилиш
муаммолари [Абжалова, 2019; 2018], тил корпуси лингвистик базасини тузиш тамойиллари
[Эшмўминов, 2019] монографик планда ўрганила бошланди. Шунингдек, ўзбек тили корпуслари
учун атов бирликларини семантик теглашнинг лингвистик асослари [Akhmedova, 2019], ўзбек-
инглиз параллел корпуси тузиш муаммолари [Mengliev, 2019] ҳақида бир қатор мақолалар нашр
этилди. Шундай назарий тадқиқотлар натижасида амалий лойиҳалар ишлаб чиқилиб, натижалари
дастурлаш ва электрон маҳсулот ишлаб чиқишга йўналтирилди.
Асосий қисм
Жаҳон тилшунослигида табиий тилга автоматик ишлов бериш, лингвистик таҳлил дастури –
анализаторлар яратиш, ахборот-қидирув тизими таҳлил дастурлари, замонавий ахборот
технологиялари воситаларида ишлов беришни йўлга қўйиш учун тил корпуслари, электрон
таржимон, тезаурус, орфокорректор, уларга дастлабки автоматик ишлов бериш воситалари
(лемматизатор, морфоанализатор, стеммер, парсер, орфокорректор) ҳамда уларнинг лингвистик
таъминотини яратиш каби устувор йўналишларда тадқиқотлар олиб борилмоқда. Улар орасида
лингводидактик хусусиятга эга бўлган таълимий корпуслар алоҳида ўринга эга. Алишер Навоий
номидаги Тошкент давлат ўзбек тили ва адабиёти университетида бажарилиши 2020-2021
йилларга мўлжалланган АМ-ФЗ-201908172 рақамли “Ўзбек тили таълимий корпусини яратиш”
мавзусидаги амалий лойиҳа доирасида илк маротаба ўзбек тилининг таълимий корпуси устида иш
бошланди. Қуйида шу лойиҳа маҳсули бўлган Ўзбек тили таълимий корпусининг қидирув тизими,
унинг ўзига хос хусусиятлари ва эришилган натижалар хусусида баҳс юритилади.
Маълумки, тил корпуси – маълум бир табиий тилдаги электрон шаклда сақланадиган
ёзма/оғзаки, автоматлаштирилган қидирув тизимига жойлаштирилган матнлар йиғиндиси. Шу
сабабли тил корпусининг энг муҳим қисмларидан бири бу – унинг қидирув тизими. Корпусдан
51
* ТошДЎТАУ профессори, филология фанлари доктори
52
* Термиз давлат университети катта ўқитувчиси
53
* ТошДЎТАУ докторанти, филология фанлари бўйича фалсафа доктори (PhD)
Do'stlaringiz bilan baham: |