Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“O‘ZBEK MILLIY VA TA’LIMIY
KORPUSLARINI YARATISHNING NAZARIY
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021)
128
зарурий ахборотни олишга ёрдамлашадиган бир неча махсус дастурий воситалар – конкорданс
(қидирув тизимининг нисбатан оддий кўриниши) ёки корпус менежери мавжуд. Корпус
менеджери махсус қидирув тизими, у корпус маълумотларини олишга мўлжалланган бир неча
дастурлардан иборат бўлиб, статистик ахборот ҳамда қидирув натижасини фойдаланувчига қулай
шаклда тақдим этади. Қидирув натижаси конкорданс – қидирилаётган бирлик лексик боғланиш
ҳолатида манбага илова қилинган контекстлар рўйхати шаклида намоён бўлади. Корпус
менеджерининг қидирув имконияти аниқ сўзшакли, сўзнинг
лемма
(корпусда лексема шундай
аталади) шакли, бирикмали бўлинган/бўлинмаган синтагма, морфологик белгиларга асосланган
жамланма шаклини қамраб олади. Талаб қилинган ҳажмдаги контекст кўрсаткичлари қидирув
натижаси, сараланган материални алоҳида файлда сақлаш имконини беради [Плунгян; 25]. Корпус
маълумотини қайта ишлаш учун маълумотлар базасини бошқариш ёки қидирувнинг янги
тизимини ишлаб чиқиш мумкин.
Корпус ёрдамида бажариладиган амалларнинг самарадорлигини ошириш мақсадида унинг
қидирув тизимига тўлиқ конкорданс рўйхатини тузиш; алоҳида сўз, мураккаб бирлик қидирувини
амалга ошириш; қидирув натижасини бир неча мезон асосида саралаш; фойдаланувчига
қидирилган сўз шаклини кенгайтирилган кўринишда тақдим этиш; корпуснинг ҳар бир элементи
ҳақида статистик ахборот бериш; леммаларни акс эттириш; сўзшаклнинг морфологик хусусияти
ҳақида ахборот бериш; матннинг барча турдаги форматини (txt, rtf, doc, html, xml) ўзида сақлай
олиш; тажрибали ва янги фойдаланувчи учун бирдек енгил ва интуитив тушунарли бўлиш каби
умумий талаблар қўйилади [Кутузов; 28].
Корпус бўйича қидирув тахминан қуйидаги натижани бериши лозим [Захаров, 2005; 34]:
1.
белгиланган сўзнинг турли контекстдаги барча шаклдаги кўриниши;
2.
тилнинг луғат таркибидаги ўрни ва вариантлари;
3.
белгиланган сўз билан бирикиш имкониятига эга сўзлар рўйхати;
4.
сўзнинг денотатив, коннотатив маъноси;
5.
лексик қўлланишнинг яширин модели (имконияти);
6.
тил тараққиётининг турли даврида қўлланиш ҳолати.
Корпус ичидаги қидирув нафақат талаффуз қилинаётган матн, балки имо-ишора (бошни
қимирлатиш, елка қоқиш ва ҳ.) ҳамда нутқий ҳаракат тури (розилик, пичинг, кесатиқ, киноя ва ҳ.)
орқали ҳам амалга оширилиши мумкин.
Фойдаланувчини корпус билан таништирувчи энг асосий таркибий қисм бу – интерфейс.
Фойдаланувчи корпус билан осон ишлаб кетиши интерфейснинг мукаммал, тушунарли, ўзига хос
усулда тузилганлигига боғлиқ. Ўзбек тили таълимий корпусини ишлаб чиқишда умумий талаблар
билан бирга ўзбек тили хусусиятлари, ўқувчи ёшига мос жиҳатларига алоҳида эътибор қаратилган.
Қуйида корпус интерфейсини таҳлилга тортамиз (Қаранг: 1-чизма).
Do'stlaringiz bilan baham: |