Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“O‘ZBEK MILLIY VA TA’LIMIY
KORPUSLARINI YARATISHNING NAZARIY
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021)
118
ПАРАЛЛЕЛ МАТНЛАР КОРПУСИНИНГ МАДАНИЙ МУНОСАБАТЛАРНИ
ЁРИТИШДАГИ ЎРНИ
THE ROLE OF PARALLEL CORPUSES IN CULTURAL RELATIONS
Рахманова Азизахон Абдугафуровна
*
46
Акрамджанова Мадина Исматуллаевна
*
47
Aннотация
. Компьютер лингвистикаси табиий тилларнинг математик моделларини
қуриш, лингвистик муаммоларни ҳал қилувчи компютер дастурларини ишлаб чиқишдан иборат.
Компьютер лингвистикасининг асосий масалалари умумий тилшуносликнинг формал ва
аксиоматик моделларини қуриш ва конкрет тилларнинг моделларини ишлаб чиқишдир.
Калит сўзлар
: Компьютер лингвистикаси, корпус, адабий тил, матнлар корпуси, бадиий
асар.
Annotation
. Computer linguistics is the construction of mathematical models of natural languages,
the development of computer programs that solve linguistic problems. The main issues of computer
linguistics are the construction of formal and axiomatic models of general linguistics and the
development of models of specific languages.
Keywords
: computer linguistics, corpus, literary language, text corpus, fiction.
Компьютер лингвистикаси тараққиётини таъминловчи асосий лингвистик омил электрон
матнлар корпуси ёки параллел матнлар корпусларидир. “Корпус сўз, сўз бирикмаси, грамматик
шаклларни, сўз маъносини муайян қидирув тизими орқали топишни англатувчи электрон
кўринишдаги матнлар жамланмасидир” [http://ruscorpora.ru; http://ruscorpora.ru].
Компьютер лингвистикасида “корпус” тушунчасида “матнлар корпуси” термини кенг
қўлланади. “Жаҳон тилларининг жуда кўпчилиги мукаммаллик даражаси, матнни қайта ишлаш
имконияти билан фарқ қилувчи ўз миллий корпусларига эгалиги, бугунги кунда лингвистик
тадқиқот ва амалий топшириқлар ечими учун тил корпуслари замонавий тилшуносликнинг инкор
этиб бўлмас иш қуролига айланганлиги, корпуснинг оддий электрон кутубхонадан фарқи, корпус
аннотацияси, конкорданс (қидирув тизимининг нисбатан оддий кўриниши) ёки корпус менеджери,
унинг қидирув имконияти, корпус менеджерига қўйилган умумий талаблар ёритиб берилган.
Корпуснинг лексикография, лексикология, синтактис, услубиятни ўрганишдаги лингвистик
аҳамияти, лингводидактика, она тили, хорижий тил таълимидаги ўрни ёритиб берилган”
[Ҳамраева, 2018: 9]. “Матнлар корпуси – электрон ҳолда сақланадиган маълум тил бирликлари
бўлиб, улар тилшунослар учун турли хил муаммоларни ҳал этиш мақсадида ва турли
йўналишдаги тадқиқотлар учун заруриятга қараб турли шаклларда тузилади. Булар фонема,
графема, морфемалардан тортиб ундан каттароқ бирликлар – лексема, гап ва матнлар (бадиий ёки
илмий асар, газета ва журнал матнлари)дан ташкил топиши мумкин. Уларнинг қай тарзда
сақланишига қараб махсус дастурлар ёрдамида ҳар бир керакли сўз ёки сўз бирикмасининг
мисоллари, имло бўйича вариантлари, синонимик қаторлари топилиши мумкин. Матнлар
корпусига оид илмий тадқиқотлар салмоғининг кўпайиши натижасида тилшуносликда корпус
лингвистикаси йўналиши шаклланди [Баранов,2001; Пўлатов,2007; Раҳимов, 2011].
Тадқиқотларда корпус компьютер лингвистикасидан алоҳида йўналиш сифатида
қаралмоқда. Биз корпуснинг, корпус яратиш муаммоларининг, мақсади, вазифаларини назарда
тутиб, уни компьютер лингвистикаси йўналиши сифатида талқин қилувчи қарашларни
қувватлаймиз. Компьютер лингвистикаси табиий тилни қайта ишлаш, тил масалаларининг
компьютер тизими орқали ҳал қилиниши, тил ўргатиш, матнни таҳрир қилиш, таржима қилиш
муаммолари билан шуғулланар экан, корпуслар ҳам бевосита тил бирликлари, тил бойлигини акс
эттирадиган катта ҳажмдаги бутунлик, лингвистик тадқиқотлар учун маълумотлар базаси
ҳисобланади. Шу боис корпуснинг компьютер лингвистикаси йўналиши сифатида, корпус
46
* Таянч докторанти, Ўзбекистон Миллий университети, azizahonraa@gmail.com
47
*Ўзбекистон Миллий университети магистранти
Do'stlaringiz bilan baham: |