Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“O‘ZBEK MILLIY VA TA’LIMIY
KORPUSLARINI YARATISHNING NAZARIY
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021)
119
лингвистикасини эса корпус турлари, корпус яратиш тамойиллари, компьютер усуллари,
муаммолари билан шуғулланувчи алоҳида соҳа сифатида талқин қилиш ўринли бўлади.
“Корпусларнинг бир қатор турлари бор: бир муаллиф корпуси, бир китоб корпуси, миллий
корпус. Миллий корпус тил тараққиётининг маълум бир давридаги жанрлари, услублари, ҳудудий
ва социал вариантлари – барча жиҳатларини қамраган ҳолда намоён этишдир. Рус тилининг
миллий корпуси интернет тизимида 2003-йилдан бери амал қилиб келмоқда ва ҳозирги вақтда 140
млн. сўз қўлланишига эга бўлган ҳар хил русча матнларни ўз ичига олган. Истиқболда рус
тилининг миллий корпуси 200 млн сўз қўлланишини ўз ичига олган матнлардан иборат бўлиши
кўзда тутилган [http://ruscorpora.ru; http://ruscorpora.ru]
Корпуслар адабий тил ва жонли мулоқот нутқининг асосий жиҳатларини қамраб олар экан,
сўзларнинг тарихийлигига кўра турларини: архаизм, историзм, неологизм кабиларни; сўзларнинг
қўлланиш доирасига кўра кўринишларини: диалектал сўзлар, терминлар, арго ва жаргонларни,
нутқ услуби хусусиятларини ҳам ажратиб олиш имконини беради. Корпуслар луғат фондини акс
эттирувчи манба бўлиши билан бир қаторда нутқ жараёнигача бўлган лексик бирликлар,
лексемалар, грамматик шакллар, грамматик воситалар ҳақида ҳам ахборот беради.
“Корпуснинг бошқа вазифаси лексика, грамматика, акцентология, тил тарихи соҳаларининг
барча имкониятларини намоён қилишдир. Авваллари мутахассислар текстни қараб чиқиб, ундан
зарур мисолларни қўлда кўчириб ёзар эди: бу фаолият кўп меҳнатни талаб қилар ва катта
ҳажмдаги материални ишлашга имкон бермас эди. Энди эса ўрганилаётган материал ҳажми ва
ахборот қидириш тезлиги чекланмайди, бу эса олим ёки ўқитувчининг ҳар хил типдаги матнлар
кўлами билан ишлашига имкон беради. Миллий корпуснинг асосий фойдаланувчилари ҳар хил
хил йўналишдаги тадқиқотчи-лингвистлардир. Корпус фойдаланувчилари чекланмаган. Муайян
давр ёки ёзувчи услуби ҳақидаги ишончли статистик маълумотлар адабиётшуносларни, тарихчи ва
бошқа гумантитар соҳа вакилларини қизиқтиради” [http://ruscorpora.ru;
http://ruscorpora.ru
].
Корпуснинг бир неча жиҳатлари мавжуд бўлиб, уларнинг хусусияти маълум бир тилнинг
муаммоларини тўлиқ қамраб олади.
Миллий корпус шу миллат тилида яратилган корпусларнинг барча турини ўзида жамлайди.
Натижада муайян тилда шу тилнинг барча имкониятларини ўзида акс эттирган маълумотлар
базаси шаклланади. Миллий корпусни шакллантирувчи ҳар бир корпус ўзининг хусусиятларига
кўра аҳамиятлидир.
Корпус лингвистикасида параллел матнлар корпуси ҳам муҳим аҳамият касб этади.
Параллел матнлар корпуси бадиий асар, қўлланма, оммавий ахборот воситалари, турли хил
ҳужжатларнинг икки ёки ундан кўп тиллардаги электрон кўринишларидир. Параллел корпуслар
ёрдамида бир сўз, жумла, абзац, суперсинтактик бутунликларнинг турли тиллардаги
вариантларини билиш мумкин. Параллел корпуслар маданиятлараро мулоқот кенг ёйилган
ҳозирги давр учун муҳим воқелик ҳисобланади. Параллел корпуслар орқали турли тил
муҳитидаги, маданиятлардаги универсалиялар ҳамда тилларнинг ўзига хос ментал хусусиятлари,
реалия ва лакунар бирликларни ҳам аниқлаш мумкин бўлади. Параллел матнлар корпуси
автоматик таржима ривожи учун ҳам хизмат қилади, компьютер лексикографиясининг
тараққиётини таъминлайди. Параллел матнлар корпуси ёрдамида махсус конкордансер дастурлар
ишлаб чиқилади ва турли хил ихтисослик луғатлари тузиш имконияти юзага келади.
Бадиий асар бўйича параллел матнлар корпуси, аввало, икки ёки бир неча тиллар
грамматикасидаги ўхшаш ва фарқли жиҳатларни таҳлил қилиш имконини беради. Параллел
матнлар корпуси ҳар икки тилдаги бадиий услуб хусусиятларини қиёслашда аҳамиятлидир.
Бадиий услубда тасвир воситалари, кўчимлар, образли ифодалар ҳар бир тил анъанасига мос
равишда акс этади. Масалан, “мушк” (қора рангли хушбўй модда)нинг қошга, сочга, “шаҳд”
(асал)нинг лаб ёки сўзга, “лола”, “ёқут”нинг лабга, эгик қоматнинг “ёй” ёки “камон”га нисбат
берилиши, туя, карвон, работ, от, ит кабиларнинг бадиий тимсоллар сифатида ишлатилиши ўзбек
мумтоз матнларига хос тасвир услубини намоён этади. Муаллиф нутқида тиллларнинг грамматик
хусусиятлари ўз ифодасини топса, қаҳрамонлар нутқида адабий тил ва шева сўзларининг уйғун
равишда қўлланиши образли тасвир маҳоратини ёритишга хизмат қилади. Бадиий матнлар
асосидаги корпус муайян тилларга хос бирликлар – реалия бирликларни ҳам ўз ичига олади.
Параллел матнлар корпуси реалия бирликлар таржимасидаги тамойилларни ҳам аниқлашга
имкон беради. Реалия бирликларнинг калкалаш, семантик калкалаш, эквивалент сўзни танлаш
Do'stlaringiz bilan baham: |