Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“O‘ZBEK MILLIY VA TA’LIMIY
KORPUSLARINI YARATISHNING NAZARIY
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021)
264
Кўриниб турибдики, табиий тил матн синтези табиий тил матнини таҳлил қилиш учун
тескари алгоритмдир.
Лингвистик процессорнинг сифати ҳозирги кунда бир қатор муҳим омиллар билан
белгиланади. Яъни ахборот объектлари ва улар орасидаги боғланишларни танлаш қобилияти,
идентификация қоидалари, тартиби ва табиий тил матнларини ташкил этиш мураккаблиги,
шунингдек, янги ахборот объектларини яратиш ҳамда матн таҳлилига ажратилган вақтни назорат
қилиш [Мушкова]. Демак, лингвистик процессорларнинг ривожланиши сунъий ақлни яратишга
қаратилган яна бир қадамдир, чунки матнни табиий, инсон тилида аниқ таҳлил қилиш учун идеал
алгоритмни яратиш тилнинг қандай ишлаши ва фикрни тушуниш учун калит бўлади.
Айтиш мумкинки, семантик анализатор матнларни таҳлил қилиш қобилиятига эгалиги
билан характерланади. У автоматик гаплар структурасини аниқлаб, ҳар бир сўзнинг маъносини
тушунтириб беради (бунда расмий семантик тилдан фойдаланади). Иккинчи томондан, семантик
таҳлил – реал вазифаларни ҳал этиш йўлида биринчи қадам.
Семантик анализатор иккита асосий ҳаракатни амалга оширади – сўзнинг тўғри маъносини
танлаш (компьютерда талқин қилиш) ва танланган маъноларни мустақил семантик изоҳга эга
бўлган сўзларга боғлаш.
В.А.Тузовнинг “Компьютерная семантика русского языка” [Тузов, 2004: 391] китоби
замонавий информатиканинг асосий муаммоларидан бири – рус тилидаги матнларни семантик
таҳлил қилишга бағишланган. Унда семантик тил, рус тилининг семантик луғати, алгоритм
масалалари борасида амалий ишлар кўрсатилган ва ҳал этилган. В.А.Тузовнинг ёндашуви рус
тилини амалда расмийлаштириш муаммосини ҳал қилишдаги дастлабки уринишлар билан боғлиқ.
У ўз китобида формал (семантик) тил ҳар қандай табиий тил ҳукмини қатъий аниқ шаклда ёзишга
имкон берганда; табиий тил сўзларининг формал тасаввурларини ўз ичига олган семантик луғат
мавжуд бўлганда; табиий тил матнини расмий шаклга айлантирувчи анализатор яратилганда
расмийлаштириш амалга оширилган, деб ҳисоблаш мумкинлигини кўрсатади.
Ҳозирги кунда рус тили учун учта компонент муваффақиятли амалга оширилган, аммо
расмийлаштириш ўз-ўзидан бўлмайди: бунинг учун амалий тизимларни қуриш, натижаларни
оқилона қўллаш керак. Матн ва компьютер дастури ўртасида ягона фарқ шундаки, табиий тилда
гап маъноси анча чуқур яширинган бўлади. Бундай маънони компьютер доим ҳам “англай
олмайди”, одатда, “ожизлик қилади”.
Анализаторнинг энг асосий қисмини синтактик-семантик луғат ташкил этади. Уни ишлаб
чиқиш учун ойлар, ҳатто йиллар керак бўлиши мумкин, чунки тизим томонидан эътироф этилган
барча сўзларни расмий баён қилиш керак бўлади (чунки дастур ҳар бир сўзнинг маъносини
билмасдан матннинг мазмунини англай олмайди).
1.
Манбаларда матн ва дастурлаш тили орасидаги алоқанинг асосий босқичлари
қуйидагича кўрсатилади [Мозговой, 2006: 46]:
Do'stlaringiz bilan baham: |