Гули Тоирова
Бухоро давлат университети
филология фанлари бўйича
фалсафа доктори(PhD), доцент
Гуласал Хайруллаева
Лингвистика йўналишининг 1-
босқич магистранти
НУТҚНИ ТЎҒРИДАН-ТЎҒРИ РАЗМЕТКА ҚИЛИШ
ТИЗИМИНИ МОДЕЛЛАШТИРИШ
(А.Навоий асарлари мисолида)
Охирги
ўн
йилликларда
матннинг
автоматик
таҳлил
инструментларини ишлаб чиқишда ва матнни табиий тилида разметка
(белгилаш) соҳасига оид янгиликларда мисли кўрилмаган даражада
сифатли ўзгаришлар юз берди[1,2,8,9]. Бу ҳодисани соҳа
мутахасисслари сифатий сакраш деб баҳолашди. Бу сакраш замонавий
компьютер лингвистикаси соҳасида эришилган ютуқлар,
усулларни
фаол ўзлаштириш ва компьютер фани ҳамда статистикаси, машина
ўқийдиган матн маълумотлари ҳажмининг экспоненциал ўсиши,
шунингдек электрон лингвистик ресурсларнинг ривожланиши сабабли
юз берди. Лингвистик таҳлилнинг замонавий инструментлари
матннинг нафақат грамматик (морфологик, синтактик)
хусусиятларини,
балки матннинг баъзи семантик ва прaгматик хусусиятларини ҳам
автоматик тарзда разметка (белгилаш)га имкон берди. Табиий тилни
машина тўлақонли тушуниши, аввалгидек футурология соҳаси
зиммасига қолаяпти, аммо комьютер лингвистикаси технологияси матн
материалларини тадқиқ қилишнинг янги имкониятларини очиб берди.
Компьютер лингвистикасининг замонавий усуллари қўлланилган
разметка (белгилаш)ларнинг автоматлаштирилган инструментарийсини
ишлаб чиқишдан ва уни миқдорий тадқиқотлар учун қўллашнинг
намойишидан иборат[7,8,9]. Мазкур ёндашув, матн тилини автоматик
воситалар билан ва бадиий асарни филологик тадқиқот вазифалари
билан тадқиқ қилиш имкониятлари орасида юзага келадиган юқорида
қайд этилган қийинчиликларни баратараф қилишга имкон яратади.
Персонажлар тизимини миқдорий таҳлили учун мўлжалланаган бадиий
матнинг машина ўқийдиган семантик разметка (белгилаш)лари,
А.Навоийнинг асарлари мисолида семантик разметка ( белгилаш)ларни
амалга ошириш мумкин. Шундай қилиб,
бадиий асарнинг мазмуний
элементларини
тадқиқ
қилиш
учун
замонавий
компьютер
лингвистикаси инструментларидан ва маълумотларни статистик усулда
таҳлил қилишнинг имкониятлари қўрсатиб берилган. Шу йўсинда,
йирик шаклдаги насрий ёки шеърий асарнинг персонажлар тизимининг
матндаги репрезентацияси тадқиқот объекти бўлиб ҳизмат қилади.
Персонажларнинг параметрик тавсифлари тадқиқотнинг предмети
бўлиб хизмат қилган.
Асар персонажи – бу, бир томондан, соддалаштирилган
(схематик, стереотипик тарзда), ва ёки ўзининг бадиий тимсолида жуда
ҳам мураккаб тузилишга эга бўлган бадиий образ, шахснинг кўлда
яратилган моделидир. Шу билан бир қаторда
энг мураккаб бадиий
образ ҳам матнда аниқ кетма-кетликда тилга олинганда вужудга келади
– Е.В. Недошивина нинг бу каби функционал таърифини таққослаймиз:
“Адабий персонаж – бу, моҳиятан, бир матн чегарасида бирта
шахснинг пайдо бўлишининг кетма-кетликдаги сериясидир” [6].
Персонажнинг матнга киришлари турли хил бўлиши мумкин:
исмларнинг вариантлари (Фарҳод, Ширин, Мажнун, Лайли, Султон
Ҳусайн Бойқаро, Бадиуззамон), титуллар ва гоноротивлар (жаноби
олийлари), анафорик эсланишлар (у), бошқа персонажларнинг
нутқидаги мурожаатлар (муҳтарам зот, сиз), ролли ва вазиятли
тавсифлар (ёш йигит, келаётган киши, яраланган) ва бошқалар. Аммо
ўта муҳим бўлган бу каби киришлар ва шакллантириладиган
лингвистик белгилар аниқ чегараларга эга (атоқли отлар,
кишилик
олмошлари) ва шунинг учун ҳам улар компьютер лингвистикаси
воситаларида мавжуд бўлган разметкаларга мос тушади. Шундай
қилиб, персонаж бадиий асарнинг шундай элементи бўлиб кирадики, у
ўзида бадиий мураккаблик ва ўта теранлик билан матнда
автоматлаштирилган разметка имконини ўзида мужассамлаштиради.
Навоий асарида битта персонаж бир неча пресонаж билан
мулоқотга киришиши ёки бир персонаж ўз ўрнини кўплаб
қаҳрамонларга бўшатиб бериши мумкин. “Персонаж
бир нечта
саҳифадан сўнг яна қайта пайдо бўлиш ва ўсиб бораётган бирликка яна
бирта бўғин қўшиш учун йўқолади, ўзини ўрнини бошқаларга
бўшатиб беради. Такрорланувчи, у ёки бу даражада барқарор белгилар
персонажнинг хусусиятини ташкил этади ” [6]. Матнда лингвистик
нуқтаи назардан ҳар бир янги кириш, уни ўраб турган контекстнинг
ўзига хослигига ва мувофиқ лексемаларнинг грамматик (сўз
ўзгартирувчи) хусусиятларига ишора қилувчи бир қатор белгилари
билан тавсифланиши мумкин. Бу персонажларнинг миқдорий
тадқиқотлари учун кенг имкониятлар очиб беради.
Навоий асардаги
персонажлари нутқ матннини семантик разметка (белгилаш)га
қуйидаги усулини ишлаб чиқиш ва унинг апробациясини таклиф
этамиз: бадиий асар персонажлари тизимини моделлаштириш; матнида
персонажлар қўлланилишини автоматик разметка (белгилаш); мавжуд
бирта аниқ персонажнинг ягона кореферент занжирига мукаммал
персонаж идентификатори ёрдамида боғланган.
Матнни автоматик қайта ишлашнинг замонавий воситалари
орқали аҳамиятли маълумотларни ва
бадиий асарлар персонажлари
тизимини семантик белги шаклида структуралаш учун қўлланилиши
мумкин.Тайёрланган разметкалар персонажлар тизими таҳлилини
миқдорий методлар билан амалга оширишга имкон беради
(такрорланишлар таҳлили, кўп омилли сатистик таҳлил, корреляцион
таҳлил, тармоқли таҳлил). Разметкалардан олинган маълумотларни
таҳлил қилишнинг аниқ усулини (методини) танлаш, персонажларнинг
айнан қайси тизими олинган моделда қўлланилашга боғлиқ бўлади.
Разметкалар, матнларни TEI халқаро кодлаш формати асосида
бажарилади[5,7].
Разметкалар
персонажларнинг
идентификация
қилинган эслашларини ўз
ичига олади, шу жумладан анафорик
ишоралар, адресат ва адресантга персонажнинг кўчирма гапидаги
репликаларининг бир маъноли ишораларини ҳам қамром олиш керак
бўлади.