O‘zbekiston respublikasi fanlar akademiyasi


Сўзларни сегментация қилиш



Download 2,9 Mb.
Pdf ko'rish
bet50/79
Sana24.02.2022
Hajmi2,9 Mb.
#247036
1   ...   46   47   48   49   50   51   52   53   ...   79
Bog'liq
5e463f2487433

Сўзларни сегментация қилиш. Матннинг ажратилган сатрлари қўлёзма 
матнини таҳлил қилиш тизими ишининг ушбу босқичида алоҳида сўзларга 
ажратилади. Сўзлар орасидаги масофа анчагина доимий бўладиган, сўзлар 
ичидаги белгилар орасидаги масофалар эса анчагина кичик бўладиган машинада 
терилган матндан фарқ қилган ҳолда қўлёзма матнида сўзлар орасидаги 
масофалар жуда кенг диапазонларда ўзгариб туриши мумкин. Одатда сўзларни 
сегментация қилиш масаласини ҳал қилишда кўтарилувчи ёндашув доирасида 
ҳаракат қилинади. Матннинг таниб олиш тизими ишининг аввалги босқичида 
битта сатрга тегишли қилинган боғланганлик компонентлари бу босқичда 
сўзларга бирлаштирилади.
[17] да тасвирдаги сўзларни ажратиб олиш учун лапласиан гауссиандан 
(LOG) фойдаланиш ва оператор параметрларини танлаб олиш усули баён 
қилинади. LOG оператори қўлланилганидан кейин матннинг боғланганлигининг 
яқин компонентлари бирга қўшила бошлайди, бундан эса берилган тасвирдаги 
сўзларни ажратиб олиш учун фойдаланилади.
Қуйидагича муқобил масалани қўйиш мумкин: матннинг боғланганлик 
компонентлари ўртасидаги бўш жойнинг сўзлар ўртасидаги бўш жойми ёки 
сўздаги ҳарфлар ўртасидаги бўш жой эканлигини аниқлаш ва бу масалани 
классификация усуллари билан ҳал қилиш. Битта сўз қисмлари ўртасидаги масофа 
одатда сўзлар орасидаги масофадан кам бўлганлиги учун “бўлиниш метрикалари” 
деб аталувчи усулдан фойдаланилади: боғланганлик компонентлари ўртасидаги 
оралиқ учун маълум бир катталик ҳисобланади ва бўсағавий қиймат билан 
солиштирилади.
[18] да сегментация қилишнинг уч босқичли нейрон тўрига асосланган 
усули таклиф қилинади. Бу усулда аввалдан ажратиб олинган сатрдаги сўзларни 
сегментация қилиш иккита объект ўртасидаги бўш жойни синфларга ажратиш 
масаласи сифатида қаралади. 
Нормаллаштириш. Дастлабки ишлов беришнинг бу босқичининг мақсади 
қўлёзма объекти тасвирларини уларни чизишнинг алоҳида хусусиятларини 


73 
сезиларли даражада йўқотмасдан маълум бир стандарт кўринишга келтириш 
ҳисобланади.
Сўзлар ёки умуман сатрларни тенглаштириш усулларидан кўпроқ 
фойдаланилади. Хатнинг қиялик бурчагини тенглаштириш, сўз ёки унинг 
қисмларининг кенглиги ёки баландлигини нормаллаштириш алгоритмлари 
камроқ қўлланилади. Бу алгоритмларнинг яширин Марков моделлари усуллари 
ёрдамида ажратиб олинган белгилардан фойдаланган ҳолда қўлёзма матни 
муаллифини идентификация қилишга қўлланилишининг таъсири [19] да тадқиқ 
қилинган. Ушбу тадқиқотларнинг натижалари кўрсатилган усуллар ёрдамида 
белгиларни ажратиб олиш учун сўзлар баландлигини нормаллаштириш 
кўринишидаги дастлабки ишлов беришнинг энг самарали эканлигини кўрсатди. 
Белгиларни ажратишнинг айрим усулларини қўллашдан аввал қўлёзма 
объектларини ингичкалаштириш усулларидан фойдаланилади [20-22]. Бу 
усуллардан фойдаланишнинг мақсади қўлёзма матнининг ушбу матн штрихлари 
кенглигининг ўзгаришига нисбатан барқарор бўлган белгиларини ажратиб олиш 
ҳисобланади. 
Қуйида юқорида санаб ўтилган масалаларни ҳал қилиш учун таклиф 
қилинадиган алгоритмлар баён қилинади. 

Download 2,9 Mb.

Do'stlaringiz bilan baham:
1   ...   46   47   48   49   50   51   52   53   ...   79




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish