имкониятлари,
синтактик
разметкаланган
корпусларнинг
дастурий
таъминотлари хусусида фикр юритилади. Бобнинг "
Жсцон тилшунослпгида
синтактик теглаш назарияси ва амалиёти хусусида"
деб
аталувчи биринчи
фаслида синтактик теглаш борасида жахон компьютер лингвистикасида
килинган ишларнинг умумий тавсифи келтирилади. Синтактик теглаш —
матннинг синтактик тахлилига тегишли теглар мажмуи, морфологик тахлил
асосига куриладиган парсинг натижаси. Разметканинг бу куриниши лексик ва
бошка синтактик курилмалар (содда ran, кушма ran, кучирма ran) орасидаги
синтактик алокани курсатади23. Илк корпусларни
яратишда синтактик
разметкапаш ноавтоматик булса, кейинги авлод корпусларининг синтактик
разметкаси парсинг дастури асосида, автоматик/ярим автоматик тарзда
амалга оширилган. Синтактик разметканинг турли усуллари мавжуд: бири
гапда суз богланишининг шажара усули булса, иккинчиси матн бирлиютарига
синтактик тег бириктириш оркали амалга оширилади. 1993
йилда Ланкастер-
Осло/Берген (ЛОБ) ва Британия миллий корпуси (BNC) муаллифи Ж.Леич
томонидан 1993 йилда тузилган аннотациялаш постулатлардан бири -тил
белгиларини аник, тушунарли тавсифлаш принципи эътиборга молик. Унинг
фикрига кура, умумфойдаланишга мулжалланган корпуснинг разметкаси уч
принципга мувофик келиши керак.
1. Разметка (корпус аннотацияси) фойдаланувчи учун кулланма ёки
курсатма шаклида мавжуд булган тахлил схемасига асосланган булиши
хамда хар бир параметр ундан жой олиши керак.
2. Фойдаланувчи учун очик корпус разметкаси “назарий жихатдан
нейтрал’' булиши лозим: разметка параметрлари
барча учун тушунарли
булган тушунчалар тизимидан иборат булиши тапаб этилади. Агар корпус
аник бир лойиха учун мулжалланган булса, уни разметкалашда махсус, айнан
муаллифга хос хамда умумкабул килинган таснифдан фойдаланиш лозим:
бунда хам тузувчидан у ёки бу тил назариясига таяниш талаб килинади.
3. Корпус аннотацияси схемаси ким томонидан, кайси аудиторияга
мулжалланганлиги аник, равшан курсатилиши лозим, чунки корпусдан
фойдаланишда турли юридик ва техник чегаралар мавжуд24.
Демак, синтактик теглар тизимини
ишлаб чикиш учун компьютер
технологиялари ютуклари билан бирга узбек тилшунослпгида синтаксис
буйича яратилган назариялар асосида корпуснинг парсер дастурини ишлаб
чикиш мумкин.
Бобнинг
“Синтактик разметка ва унинг турли корпуслардаги
имкониятлари”
номли иккинчи фаслида синтактик аннотация (разметка)
турлари
тадкик
этилади.
Ж.Лич
томонидан
яратилган
синтактик
аннотациялаш принципи хакидаги назарий материапларни кузатишимиз
шупи курсатдики, синтактик аннотацияси мавжуд корпуснинг аудиторияси
Do'stlaringiz bilan baham: