1.2. Qoraqalpoq tilining gramatik va morfologik tahlili
Шуни таъкидлаш керакки, турли хил тиллар турли хил семантик ва грамматик хусусиятларга эга, шунинг учун кўпинча битта тилни қайта ишлаш учун муваффақиятли ишлатилган алгоритмлар бошқа тилда жуда паст самарадорликни кўрсатади. Табиий тилни қайта ишлашнинг мураккаблиги, аммо алгоритмик равишда ечилиши мумкин бўлган торроқ муаммоларни аниқлаш имкониятини истисно этмайди: масалан, нутқ қисмларини аниқлаш ёки матнларни мантиқий гуруҳларга бўлиш. Бироқ, табиий тилларнинг айрим хусусиятлари ушбу ечимларнинг самарадорлигини сезиларли даражада пасайтиради. Шундай қилиб, масалан, ҳар бир сўз учун барча сўз шаклларини ҳисобга олиш қорақалпоқ тилида матнни қайта ишлашнинг мураккаблигини катталиги бўйича оширади. Эътибор беринг, туркий тилларнинг катта гуруҳига кирувчи қорақалпоқ тили агглютинат илга ишора қилади.
Агглютинатив типдаги тилларнинг асосий хусусияти шундаки, мустақил сўзларнинг шакллари асл шаклга эркин бириктирилган аниқ маъноли қўшимчалар ёрдамида ҳосил бўлади. Аg-glu-tinatio атамаси этимологик маънода «ёпишиш» маъносини англатади.
Агглютинатив тилларнинг муҳим хусусиятларига қуйидагилар киради.
сўзнинг синтагматик тузилишининг шаффофлиги, морфемаларга эркин артикулятсия қилиш;
парадигматик структуранинг эксенел табиати, сўз шаклларининг эркин конструктивлиги;
сўзнинг чизиқли хусусияти, илдизнинг илдизга ва грамматик маънолар сони жиҳатидан янада мураккаб сўз шаклларини яратишга хизмат қиладиган ҳар қандай сўз шаклига тўғри келиши.
Агглютинатив аффикслар қуйидаги белгилар билан тавсифланади:
ноаниқлик: ҳар бир аффикс одатда битта тоифани ифодалайди;
стандарт: аффикс одатда вариантга эга эмас;
сўзга эркин риоя қилиш.
Қорақалпоқ тили агглютинатив тилларга тегишли. «Агглютинатив тиллар учун грамматик шаклларни шакллантиришнинг самарали усулларидан бири бу аффиксация, яъни сўзнинг илдизига грамматик зарралар-қўшимчаларни бириктириш ёки қўшмасликдир, бу орқали сўз ясалиши ёки бурилиши амалга оширилади». Масалан: жала-тухмат, жала+қор – тухматчи, бала – бола, бала+лық – болалик, пахта – пахта, пахта+шылық – пахтачилик, бас – бош, бас+қар – бошқар, көп – кўп, көб+ей – кўпайтирмоқ.
Сўз ясалиши қўшимчаларини сўзнинг илдизига ёки асосига қўшилишида маълум бир қонуният мавжуд: сўз бирикмаларининг асосий грамматик категорияларини ташкил этувчи лексик ва грамматик сўз ясалиш қўшимчалари аввал асосга, сўнгра функционал грамматик сўз ясовчи қўшимчаларга бириктирилади.
Бурилиш аффикслари гапдаги сўзларнинг бир-бирига бўлган муносабатининг турли шаклларини ҳосил қилади. Улар тўрт гуруҳни ташкил қилади:
сўз ясаш ва бурилиш ўртасида оралиқ шакл ҳосил қилувчи сон қўшимчалари;
таъриф ва таъриф ўртасидаги синтактик алоқани ифодалашга хизмат қиладиган тегишли аффикслари;
қўшимчалар ёки ҳолатлар, иккинчи томондан, предикатлар ўртасидаги синтактик алоқани ифода этувчи форма вазифасини бажарувчи ҳолатлар ва постпозициялар;
гапдаги сўзларнинг предмет-предикат муносабатини ифодалайдиган юз қўшимчалари (балық+шы+лар+ы+мыз+да -балиқчиларимизда) [23, 24]. Морфологик анализатор - бу луғатдаги алоҳида сўзлар ва сўз шаклларини таққослаш (аниқроғи лекцикон) ва сўзларнинг грамматик хусусиятларини аниқлаш билан шуғулланадиган алгоритмлар тўпламидир.
Синтактик таҳлил гапни таҳлил қилиш жараёнида сўзларни морфологик таҳлил қилиш натижаларидан фаол фойдаланади, гарчи у таниб олмасдан ишлаши мумкин. Бироқ, матнни грамматик маълумот билан белгилаш, таҳлил қоидаларини тузишни жуда осонлаштиради.
Мисол тариқасида сифат ва от ўртасидаги муносабатни белгилайдиган қоидани қабул қилишингиз мумкин. Рус грамматикаси қоидаларига мувофиқ, исмнинг чап томонидаги сифат, агар улар бир хил ҳолатда бўлса, у билан боғланади .
Ушбу қоида сифат ва отни боғлаш учун ягона мумкин бўлган асос эмас, лекин у энг кенг тарқалган ҳолатни тавсифлайди.
Рус тили морфологиясини расмийлаштиришга қаратилган ҳар қандай уриниш муқаррар равишда турли хил грамматик шаклларнинг тасодифийлиги каби муаммога дуч келади. Масалан, "китоблар" сўзига қараб, биз "эски китоблар столда" номинатив сонининг кўплиги билан, "бу эски китобларни ташлаб юбориш" ёки алоҳида бирлик билан боғлиқми ёки йўқми, аниқ айтиш мумкин эмас. Таниб олувчининг вазифалари сўзнинг грамматик шаклини таниб олишнинг барча мумкин бўлган вариантларини топишни ўз ичига олади, шунингдек, ушбу контекстда аниқ ва равшан тақиқланган таниб олиш вариантларини истисно қилади. Омонимияни олиб ташлашнинг ушбу муаммосини бир нечта алоҳида вазифаларга ажратиш мумкин, уларни ўзларининг махсус алгоритмлари ҳал қилади.
Таниб олувчининг кўп вақтни талаб қиладиган сўнгги вазифаси - номаълум сўзларнинг мумкин бўлган грамматик хусусиятларини аниқлаш. Бошқача қилиб айтганда, агар таҳлил қилинган сўз лекцикада топилмаса, у ҳолда таниб олувчи унинг грамматик ролининг мумкин бўлган вариантлари тўғрисида тахминлар қилиши керак. Ушбу муаммони ҳал қилиш учун жуда кўп турли хил маълумотлар, шу жумладан таниб олиш қоидалари қўлланилади.
Морфологик таҳлил амалга ошириладиган тиллар.
Морфологик анализаторнинг муҳим хусусияти шундаки, у маълум бир тилга боғланиб қолмаган. Луғатнинг манба матнларида турли хил қоидалар ўрнатилган бўлиб, маълум бир тилнинг ўзига хос хусусиятлари учун морфологик таҳлил жараёнини мослашувчан равишда созлашингиз мумкин.
Масалан, рус тили учун кўп сонли қоидалар от ва сифатларнинг грамматик жинси, сони ва иши бўйича келишувини ҳисобга олган ҳолда, алоҳида сўзларни морфологик таҳлил қилиш натижаларини филтрлайди.
Луғатни йиғиш пайтида махсус дастур (луғат компилятори) қоидаларнинг матнли кўринишини ўқийди ва луғат базасида сақланадиган қулайроқ иккилик вакилликка айлантиради. Илова дастурлари ва грамматик луғат таркибий қисмлари, агар керак бўлса, қоидаларни хотирага юклайди ва уларни таниб олиш вариантларини йўқ қилиш ёки уларни тўхтатиш учун фойдаланади. Буларнинг барчаси автоматик равишда рўй беради ва дастур кодидан ҳеч қандай махсус ҳаракатларни талаб қилмайди, фақат сол_Морпҳологианалисис функциясини чақириш керак.
Грамматика двигателининг жорий версияси учун рус ва инглиз тиллари учун морфологик модулларнинг вариантлари мавжуд. Шу билан бирга, морфологик анализаторнинг русча версияси, шу жумладан Парт-Оф Спееч Таггинг алгоритми асосий ҳисобланади.
Мйстем - бу Яндех-нинг нотижорат мақсадларида фойдаланиш учун рус тилининг бепул морфологик анализатори. Морфологик анализатор С-да ёзилган алоҳида дастур сифатида ишлайди. Дастур матнли файллар билан ишлайди, бу ердан морфологизация учун маълумот олинади ёки сўзларни стандарт киритиш / чиқариш билан ишлайди. Морфологик анализатор асл сўзларнинг барча мумкин бўлган шаклларини кўрсатади.
ПҲПМорҳҳй - бу ПҲП платформасида амалга оширилган, морфологик таҳлилнинг бепул тарқатиш кутубхонаси. ПҲПМорпҳй қуйидаги вазифаларни ҳал қилишга имкон беради:
• Лемматизация (сўзнинг нормал шаклини олиш);
• Сўзнинг барча шаклларини олиш;
• сўз учун грамматик маълумот олиш (нутқ қисми, ҳолат, келишик ва ҳк);
• берилган грамматик хусусиятларга мувофиқ сўз шаклини ўзгартириш;
• Берилган расмга кўра сўз шаклини ўзгартириш.
Қўллаб-қувватланадиган тиллар: рус, инглиз, немис (АОТ). Украина, Эстония (испелл асосида). Мйиспелл луғатидан фойдаланган ҳолда бошқа тилларга ёрдам қўшиш мумкин.
Гапни морфологик таҳлил қилиш.
Дастур сизга рус тили грамматикаси қоидаларини ҳисобга олган ҳолда бир ёки бир нечта сўзларни киритишга ва уларнинг морфологик таҳлилларини ўтказишга имкон беради.
Морфологик таҳлил натижалари икки шаклда намойиш этилади.
Одатий бўлиб, дастур битта рўйхатда жумлани морфологик таҳлил қилишнинг энг ишончли натижалари рўйхатини кўрсатади.
Фойдаланувчи жумла сўзларидан бирини танлаганда, дастурда ушбу сўзнинг морфологик таҳлилининг батафсил натижалари, шу жумладан биринчи режимда кўрсатилмаслиги эҳтимоли камроқ натижалар кўрсатилади.
Анализатор кўриниши
1-расм. Рус тилидаги матнни морфологик таҳлил қилиш
2-расм. Феълни морфологик таҳлил қилиш вариантлари.
Бу ерда асосий вариантдан ташқари - контекстни ҳисобга олган ҳолда танланган рағбатлантирувчи кайфият, иккинчи вариант ҳам кўрсатилади.
Do'stlaringiz bilan baham: |