9-bob. Tabiiy tilni tushunish va mashinali koʻrish tizimlari



Download 482,99 Kb.
bet17/19
Sana26.06.2021
Hajmi482,99 Kb.
#101884
1   ...   11   12   13   14   15   16   17   18   19
Bog'liq
2-мус.иш СИ(4-курс)

Strukturali - dogʻli etalonni qoʻllash orqali anglash quyidagicha sodir boʻladi. Etalon tasvir ustiga qoʻyiladi va tasvirda ajratilgan dogʻlar orasidagi munosabatlar etalondagi dogʻlarning munosabatlari bilan taqqoslanadi. Agar tasvirda ajratilgan dogʻlar va ular orasidagi munosabatlar qandaydar belgining etalonini qanoatlantirsa, u holda bu belgi kiruvchi tasvirni anglash haqidagi gipotezalar roʻyxatiga qoʻshiladi.


      1. Cognitive Technologies dan mashinali oʻqish darslari

Tizim tamoyili asosida ishlaydi. Bu shuni anglatadiki, <(Skanerla va tani) Сканируй и Распознавай> tugmasini bosganda hujjatni qayta ishlash jarayoni ishga tushadi: skanerlash, sahifani matnli va grafik bloklarga ajratish, matnni anglash, orfografiyani tekshirish va chiquvchi faylni shakllantirishdan iborat. Buning barchasida nima turadi? Ongli algoritm hujjatning foniga bogʻliq ravishda skanerning optimal yorugʻligini avtomatik tanlashga(adaptiv skanerlash), illyustrasiyalarni saqlashga(yoki yechiladigan masalaga bogʻliq ravishda keraksiz grafik elementlarini oʻchirish) imkon beradi.

Cunie Form da bunga oʻxshash mosliklarning bir qancha usullari ishlatiladi. Birinchidan, har bir belgining shakli alohida elementar hodisalarga yoyiladi. Masalan kesishishning bir chizigʻidan boshqasigacha boʻlgan qism hodisa hisoblanadi. Hodisalar majmui belgining ixcham tavsifini oʻzida ifodalaydi.

Boshqa usullar alohida belgilar elementlari larining oʻzaro nisbatlariga va ularning xarakterli alomatlarini tavsiflashga asoslanadi. Bu tavsiflarning har biriga mos etalonlar topiladigan ma’lumotlar bazasi mavjud. Tasvirning qayta ishlashga beriladigan elementi etalon bilan taqqoslanadi. Shundan soʻng bu taqqoslashga asoslanib hal qiluvchi funksiya tasvirning aniq belgiga mosligi haqida hukm chiqaradi. Bundan tashqari past sifatli matnlar bilan ishlashga imkon beradigan algoritmlar ham mavjud. Masalan «yopishib qolgan» belgilarni ajratish uchun optimal ajratishni baholash usuli mavjud. Aksincha, «sochilgan» elementlarni birlashtirish uchun ularni birlashtirish mexanizmlari ishlab chiqilgan.

Cunie Form 96 da birinchi marta oʻzini-oʻz oʻqitish(yoki adaptiv anglash) algoritmi qoʻllangan. Ularning ishlash prinsipi quyidagidan iborat. Har bir matnda aniq va noaniq bosilgan belgilar mavjud boʻladi. Agar tizim matnni tanigandan keyin aniqlik chegaradan pastda ekanligi aniqlansa, yaxshi bosilgan belgilarning tizim generasiya qilgan shriftiga asoslangan holda matnni qayta anglash amalga oshiriladi. Bu yerda ishlab chiqaruvchilar ikki turdagi anglash tizimining afzalliklarini birlashtirishgan: birinchisi ixtiyoriy shriftni qoʻshimcha oʻqitmasdan anglash imkonini beradi, ikkinchisi past sifatli matnlarni anglashda chidamli hisoblanadi. Cunei Form 96 ni qoʻllash natijalari shuni koʻrsatdiki, oʻzini - oʻzi oʻqitadigan algoritmlarning qoʻllanilishi past sifatli matnlarni anglash aniqligini 4-5 marta oshirishga imkon beradi. Asosiysi oʻzini - oʻzi oʻqitadigan tizimlar anglash aniqligini oshirishda katta potensialga ega.

Sintaktik va lugʻatli anglash usullari muhim rol oʻynaydi va mohiyatiga koʻra geometrik anglashni taminlashda kuchli vosita boʻlib xizmat qiladi. Lekin ularni samarali qoʻllash uchun ikkita muhim masalani yechish kerak boʻladi. Birinchidan katta lugʻatga(100000 soʻz) tez murojatni amalga oshirish. Natijada soʻzlarni saqlash tizimini qurishga erishildi va bunda har bir soʻzni saqlash uchun bir baytdan oshmaydi, murojat esa minimal vaqtda amalga oshirildi. Boshqa tomondan hodisalarning alternativligiga yoʻnaltirilgan anglash natijalarini toʻgʻirlaydigan tizimni qurishga talab qilindi. Lugʻatli nazorat esa lugʻat bazasini qoʻllab, bu baholarni oʻzgartirishga imkon berdi. Natijada lugʻatni qoʻllash belgilarni qayta anglash sxemasini amalga oshirishga imkon berdi [11-15].

Hozirgi kunda anglash aniqligini oshirish masalalari bilan birga anglash texnologiyalari bilan arxivli tizimlarni birlashtirish orqali OCR-texnologilarni qoʻllanilish sohalarini kengaytirish masalalari oldingi oʻringa chiqmoqda. Boshqacha aytganda, hozir matnni kiritishni amalga oshiradigan monodasturdan mijozning hujjatni qayta ishlash sohasidagi masalasini yechadigan avtomatlashtirilgan kompleksga oʻtilyapti. Mana yarim yildirki Cunei Form 96 tashkilotlarda ma’lumotlarni birgalikda kiritishga moʻljallangan Cunei Form OCR Server anglash serveri bilan chiqarilmoqda, anglash modulini oʻz ichiga olgan elektron arxivi esa qisqa vaqt ichida katta shuhrat qozondi.

Shunday moʻljal bilan umuman anglash tizimlari haqidagi tasavvurlarni tubdan oʻzgartirgan Cunei Form96 Professional komplekti yaratildi.



      1. Qoʻlyozma matnlarni anglash

Qoʻlyozma matnlarni anglash masalasi bosma matnlarni anglashga qaraganda ancha qiyin. Bosma matnlarni anglashda biz shrift tasvirlarining chegaralangan miqdori bilan ishlasak, qoʻlyozma matnlarda esa shablonlar soni oʻlchab boʻlmas darajada koʻp. Tasvir elemetlari chiziqli oʻlchamlarining boshqa munosabatlari qoʻshimcha qiyinchiliklarni keltirib chiqaradi.

Lekin baribir qoʻlyozma matnlarni anglash texnologiyasini ishlab chiqarishning asosiy bosqichlaridan oʻtilganligini tan olishimiz mumkin. Cognitive Technologies zaxirasida barcha asosiy turdagi matnlar: stilizasiyalangan raqamlar, bosma matnlar va qoʻlyozma belgilarni anglash texnologiyalari mavjud. Ammo qoʻlyozma matnlarni kiritish texnologiyalarini moslashish(adaptasiya) bosqichidan oʻtishi talab qilinadi. Shundan soʻng hujjatlarni uzluksiz arxivga kiritish uchun vositalar toʻliq amalga oshirilganligini e’lon qilish mumkin boʻladi [11-15].

Yangi kompyuter texnologiyalarning dinamik rivojlanishi elektron hujjat ayirboshlash sektorining holatiga ham oʻz aksini topdi. Oldinlari klaviaturasiz kiritish texnologiyalarini rivojlntirish shaxsiy foydalanishning afzalliklariga qaratilgan boʻlsa, hozirgi kunda hujjatlarni kiritish va qayta ishlash texnologiyalaridan birgalikda va ratsional foydalanish afzalliklari oldingi oʻringa chiqmoqda. Hozirgi kunda birgina anglash tizimiga ega boʻlish yetarli emas. Anglangan matnli fayllar bilan nimadir qilish kerak: ma’lumotlar bazasiga saqlash, ularni qidirash, lokal tarmoq orqali uzatish va h.k. Bir soʻz bilan aytganda hujjat bilan ishlashning arxivli yoki boshqa tizimi bilan birgalikda ishlash talab qilinadi. Shunga koʻra anglash tizimi hujjatlar bilan ishlashning arxivli yoki boshqa tizimi uchun utilitga aylanadi.



Hujjatlarni skanerlash va anglash tizimlari tarmoq versiyalarining paydo boʻlishi bilan kompaniyalarda, turli xil tashkilotlarda bu texnologiyalardan birgalikda foydalanishning ba’zi bir afzalliklarini amalga oshirishga erishildi. Shu sababli, turli xil darajadagi tashkilotlarda hujjatlar bilan ishlashni avtomatlashtirish masalalarini kompaniyalar bilan birga kompleks yechish haqida gapirish muhim hisoblanadi. Cognitive Technologies ga kelsak, u tomonidan taqdim etilgan elektron arxivi, yangi utilitlar va katta loyihalarni amalga oshirishda qoʻllaniladigan texnologiyalar ma’lumotlarni kiritish tizimlarini qoʻllashni kengaytirishga va hujjatlar bilan ishlashni avtomatlashtirish texnologiyalarini ishlab chiqarishga yoʻnaltirilgan kompaniya yoʻnalishini davom ettirmoqda.


Download 482,99 Kb.

Do'stlaringiz bilan baham:
1   ...   11   12   13   14   15   16   17   18   19




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish