Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“O‘ZBEK MILLIY VA TA’LIMIY
KORPUSLARINI YARATISHNING NAZARIY
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021)
142
3-қадам. Матнни морфологик таҳлил қилиш – луғатда мавжуд бўлган ҳар бир сўз учун
барча мумкин бўлган лексик кодларни олиш.
4-қадам. Дастлабки матнни синтактик таҳлил қилиш – бир ҳил сифатлар ва отларни
гуруҳлаш, асосий / боғлиқ сўзлар дарахтини яратиш.
5-қадам. Дастлабки матнни семантик таҳлил қилиш.
6-қадам. Қурилган дарахт таржимасини акс эттириш.
7-қадам. Таржима қилинган дарахтни мувофиқлаштиришни амалга ошириш – семантик,
синтактик ва морфологик синтез.
8-қадам. Таржима қилинган жумлаларни файлга ёки буферга ёзиш.
Юқорида келтириб ўтилган ҳар бир қадамни алоҳида кўриб чиқамиз.
1-қадам. Таржима қилиниши керак бўлган матн жумлаларини юклаб олинади ва кейинги
қадамга ўтилади.
2-қадам. Матнни сўзлар ва жумлаларга бўлиш вазифаси. Кўриниб турган соддалигига
қарамай, умумий ҳолда матнни сўзлар ва жумлаларга бўлиш вазифаси осон эмас. Асосий
қийинчилик турли хил қисқартмалар, бош ҳарфлар, тўғридан-тўғри нутқ, чизиқча билан ёзилган
сўзлар ва бошқалар билан ифодаланади.
Сўзни аниқлаш махсус андозалар ёрдамида амалга оширилади. Ушбу андозалар ҳарфлар,
рақамлар ва ҳарф-рақам гуруҳлари ҳамда тиниш белгиларидан иборат бўлиб, улар алоҳида сўзлар
сифатида ажралиб туради. Масалан, алоҳида сўзлар сифатида, рақам билан ифодаланган саналар,
параграф ва қисм параграф рақамлари, қисқартмалар нуқталар билан (махсус луғатга кўра),
шунингдек, дефис билан ёзилган сўзлардир, агар улар махсус луғат модули бўлса, мураккаб
таҳлил модули томонидан тан олинган ҳоллар белгиланади. Ушбу модул қора-оқ ва шу каби
ибораларни таниб олиш учун ишлатилади. Бундай сўзларни таҳлил қилиш ва таржима қилиш
сифатларнинг морфологик ўзгаришлари учун махсус қоидалар асосида амалга оширилади.
Танланган сўзларни таҳлил қилиш натижасида баъзи сўзларга (бош ҳарфлар, қисқартмалар ва
бошқалар) махсус белгилар белгиланади, улар жумлаларнинг чегараларини аниқлаётганда
ноаниқликни бартараф этишга имкон беради. Шунингдек, ушбу босқичда луғатларни қидиришга
тайёрлаш учун сўзлар нормаллаштирилади.
3-қадам. Морфологик таҳлил. Ушбу муаммонинг ечими манба тилининг луғатига
асосланган. Луғатни қидириш натижасида ҳар бир жумла сўзига кўплаб лексик-грамматик
синфлар ажратилган: нутқнинг қисми, келишик, сон, жинси, тоифаси ва бошқалар, бу эса
кейинчалик синфларни маълум хусусиятларга асосланган ҳолда амалга оширади (масалан,
сифатлар ва отларнинг мос келишини текшириш). Луғатда сўзларни қидириш жараёни, агар у
луғатда топилмаган бўлса, асл сўзни қидиришдан ташқари, мумкин бўлган префиксларни олиб
ташлаган ҳолда сўзларни қидиришни ҳам ўз ичига олади. Префиксларни самарали қидириш учун
элементларнинг олд қисмларининг ҳарфлари бўлган дарахт тузилиши ишлатилади. Қидирув
дарахтда бошқа ўтиш бўлмаганда ёки олдинги ҳолат топилса ва луғатда ушбу предлогсиз сўз
мавжуд бўлса ҳам тўхтайди. Олд қўшимчалар луғатига қўшимча равишда ҳар бир тил учун
тиллараро ёзишмалар жадвали мавжуд бўлиб, уларнинг ёрдамида олинган сўз матн синтези
босқичида олинади. Синфни аниқлаш босқичида, шунингдек, луғатга кўра битта сўзга таржима
қилинган иборалар ҳам таъкидланади. Бундан ташқари, барча бундай иборалар битта сўз билан
берилган деб ишонилади. Бу иборани тўлиқ мувофиқлаштириш ва таржима қилишни
таъминлайди.
4-қадам. Матнларни синтаксис таҳлил қилиш. Биринчидан, ҳар бир асосий сўз учун
қидирув амалга оширилади, уни таржима натижасида мувофиқлаштириш керак. Асосий сўзларни
қидириш жараёнида ноаниқликни асосий олиб ташлаш амалга оширилади.
Синтаксис дарахт олдиндан аниқланган лингвистик боғланишларни кетма-кет таниб олиш
ва уларга асосланган муайян операцияларни бажариш орқали қурилган.
Лингвистик боғланишларни аниқлаш учун асосий операциялар қуйидагилардан иборат:
а) сўзнинг ўзига хос хусусиятларга эга бўлган нутқнинг маълум бир қисми эканлигини
текшириш (масалан, сўз генитивда от бўлганлигини);
б) маълум бир сўзнинг отонимлигини текшириш, яъни, у нутқнинг турли қисмларига
тегишли бўлиши мумкинми;
в) иккита сўзнинг мувофиқлигини текшириш;
Do'stlaringiz bilan baham: |