Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“O‘ZBEK MILLIY VA TA’LIMIY
KORPUSLARINI YARATISHNING NAZARIY
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021)
263
иккинчи томондан, матнни янада аниқроқ семантик ифодалаш усулидир. Синтактик анализатор –
лексемаларнинг кетма-кетлигини грамматик хусусиятлари билан таққословчи дастур. Ҳар қандай
парсернинг энг муҳим вазифаси морфологик таҳлил давомида олинган лексемаларнинг
морфологик хусусиятлари, луғат маълумотларидан фойдаланиб, табиий тилдa гапнинг синтактик
структурасини тузишдир. Худди морфологик анализатор сингари парсер ҳам анализ ва синтезни
ўз ичига олади.
Табиий тил матнларини бир вақтнинг ўзида морфологик ва синтактик таҳлил қилиш учун
парсерлар матнни сўз ва жумлаларга ажратиш, сон шакли ва бошқа грамматик хусусиятларни
аниқлаш, сўзнинг контекстини ҳисобга олган ҳолда сўзни дастлабки шаклига келтириш, жумлада
сўзларнинг синтактик муносабатларини аниқлаш, эга-кесимни топиш каби вазифаларни бажаради.
Бундан ташқари, морфологик анализатор матнда қилинган имло хатоларини тузатиши учун
“опечаток” (йўл қўйилган хатони тузатиш) режимини ёқиш мумкин [Волкова ва б., 2015: 36-46].
Семантик анализатор – сўровнинг синтактик тузилишини концептуал графиклар ёрдамида
семантик жиҳатдан қайта ишлаш дастури. Концептуал график семантик ёки бошқача қилиб
айтганда, табиий тилни тушуниш моделларида вазият ва билимни концептуал тасаввур қилишдир.
Графиканинг тугунлари категория ва тушунчани ифодаловчи лексик бирликлар бўлиб, бир-бирига
формал ва ассоциатив муносабат орқали боғланади. Графикдаги муносабатларнинг йўналиши ҳар
доим юқоридан пастга – умумлаштиришнинг юқори даражадаги тушунчаларидан уларни
тавсифловчи тушунчаларга йўналтирилади. Элементар маъно графикнинг бир-бирига боғланган
қўшни тугунлари сифатида аниқланади. Бундай боғланишлар ҳар доим ҳам номланмайди, баъзан
улар фақат икки сўз (талаба-институт, қайин-дарахт) ўртасидаги ўзаро таъсирнинг ҳосиласини
қайд этади. График маълум бир сўзнинг лексик фаол ва пассив валентликларини очиб берувчи,
рухсат этилган бирикмаларга кирувчи ўзаро боғланган элементар маънолар мажмуасидан иборат.
Графанинг икки тугунни бирлаштирувчи боғланган қисми кичик гуруҳни ташкил қилади.
Семантик анализатор материални қайта ишлаш жараёнининг охирги босқичидир. Лингвистик
процессор тугагандан сўнг таҳлил қилинган ахборот индексация босқичига ўтказилади.
Шундай қилиб, ТТ матнларини ишлаб чиқишнинг икки алгоритмини тузиш мумкин: матн
таҳлили алгоритми ва матнни синтез қилиш алгоритми.
1-расм.
Таҳлил алгоритми
2-расм. Синтез алгоритми
Do'stlaringiz bilan baham: |