9.2. Mashinali koʻrish tizimlari
9.2.1. Asosiy tamoyillar va idrok etishning yaxlitligi
«Kompyuterga matnni avtomatik kiritadigan» maxsus tizimlarning mavjudligini hatto boshlangʻich foydalanuvchilar ham bilishadi. Skaner qilingan tasvirdan tizim xarflarni «anglaydigan» qismlarni topadi va bu tasvirlarni haqiqiy harflar bilan, boshqacha aytganda ularni mashina kodi bilan almashtiradi. Matn tasviridan «haqiqiy» matnga oʻtish shunday amalga oshiriladi. Bunga qanday erishiladi?
«Bit» kompaniyasi tomonidan «Fontanli almashtirish» deb nomlangan belgilarni anglashning maxsus texnologiyasi ishlab chiqarilgan. Bu texnologiya asosida yuqori bahoga ega boʻlgan savdo mahsuloti ishlab chiqarilgan. Bu Fine Reader optik anglash tizimidir. Hozirgi paytda uning uchinchi versiyasi ishlab chiqarilgan boʻlib, nafaqat matnlar bilan, balki shakllar va jadvallar bilan ham ishlash imkoniga ega. Ishlab chiqaruvchilar esa uning toʻrtinchi versiyasi nafaqat bosma matnlarni, hatto qoʻlyozma matnlarni ham taniy oladigan boʻlishini bashorat qilishmoqda [11-15].
«Fontanli almashtirish» asosida yaxlitlilik tamoyili yotadi. Unga muvofiq ixtiyoriy idrok etiladigan obyekt yaxlit, ma’lum munosabatlarda oʻzaro bogʻlangan qismlardan iborat holda qaraladi. Masalan bosma sahifa boʻlimlardan tashkil topgan, boʻlimlar sarlavhalar va kolonkalardan, kolonkalar abzaslardan tashkil topgan. Abzas satrlardan, satrlar soʻzlardan, soʻzlar haflardan tashkil topgan. Bunda matnning barcha sanab oʻtilgan elementlari bir - biri bilan ma’lum fazoviy va til munosabatlar orqali bogʻlangan.
Yaxlitlikni ajratish uchun uning qismlarini aniqlash kerak. Qismlarni oʻz navbatida faqat yaxlitlikning tarkibida qarash mumkin. Shuning uchun idrok etishning yaxlit jarayoni faqat idrok etiladigan obyekt haqidagi gipotezalar doirasida yaxlit sodir boʻlishi mumkin. Idrok etiladigan obyekt haqidagi faraz oʻrtaga tashlangandan keyin uning qismlari ajratiladi va interpretasiya qilinadi. Shundan soʻng boshlangʻich gipotezaning toʻgʻriligini tekshirish uchun ulardan yaxlitlikni «yigʻish»ga harakat qilinadi. Shubhasiz, idrok etiladigan obyekt kattaroq yaxlitlik doirisida interpretasiya qilinishi mumkin.
Biror gapni oʻqib inson harflarni taniydi, soʻzlarni idrok etadi, ularni sintaktik konstruksiyalarga bogʻlaydi va uning ma’nosini tushunadi.
Texnik tizimlarda matnni anglashdagi ixtiyoriy yechimga birdaniga kirishilmaydi, balki gipotezalarni ketma - ket tekshirish va oldinga surish hamda tadqiq qilinadigan obyekt haqidagi bilimlarni ham, umumiy kontekstdagi bilimlarni ham jalb qilish orqali kirishiladi. Idrok etiladigan obyekt sinflarining yaxlit tavsifi ikkita shartga javob beradi: birinchidan, berilgan sinfdagi barcha obyektlar bu tavsifni qanoatlantiradi, ikkinchidan boshqa sinfdagi hech qanday obyekt uni qanoatlantirmaydi. Masalan, «K» harfining tasvirlari sinfi shunday tavsiflanishi kerakki «K» harfining ixtiyoriy tasviri unga tushsin, boshqa barcha xarflarning tasvirlari esa unga tushmasin. Bunday tavsif aks etish xususiyatiga ega boʻladi, ya’ni tavsiflanadigan obyektlarni qayta ishlab chiqishni ta’minlaydi: OCR tizimlari uchun xarfning etaloni xarfni vizual qayta ishlab chiqishga imkon beradi, nutqni anglash uchun soʻzlar etaloni soʻzlarni talaffuz etish imkonini beradi, sintaktik analizatordagi gapning strukturali tavsifi toʻgʻri gapni sintez qilish imkonini beradi. Amaliy nuqtai nazardan aks etish katta rol oʻynaydi, modomiki tavsiflarning sifatini samarali nazorat qilishga imkon beradi.
Yaxlit tavsiflashning ikki koʻrinishi mavjud [11-15]: shablonli va strukturali.
Birinchi holda tavsiflash vektorli yoki rastrli koʻrinishdagi tasvirni oʻzida aks ettiradi va almashtirishlar sinfi beriladi(masalan, takrorlash, masshtablashtirish va x.k.)
Ikkinchi holda tavsiflash graflar koʻrinishida aks ettiriladi. Grafning tugunlari kiruvchi obyektning tashkil etuvchi elementlaridan iborat, yoylari esa ular oʻrtasidagi fazoviy munosabatlardan iborat. Oʻz navbatida elementlar murakkab boʻlishi mumkin(ya’ni oʻzining tavsifiga ega boʻlishi mumkin).
Albatta, shablonli tavsiflashni strukturali tavsiflashga qaraganda amalga oshirish ancha oson. Lekin uni yuqori oʻzgarish darajasiga ega boʻlgan obyektlarni tavsiflash uchun qoʻllab boʻlmaydi. Shablonli tavsiflashni masalan, faqat bosma belgilarni anglash uchun, strukturali tavsiflashni esa qoʻlyozma matnlarni anglashda ham qoʻllash mumkin.
Idrok etishning toʻliqligi ikkita muhim arxitekturali yechimlarni taklif qiladi. Birinchidan, barcha bilimlar manbai imkon qadar bir vaqtda ishlashi kerak. Masalan, avval sahifani tanib, soʻngra uni lugʻat va kontekst qayta ishlashga berish mumkin emas, modomiki bu holda konteks qayta ishlashdan anglashga qayta aloqani amalga oshirish mumkin boʻlmaydi. Ikkinchidan, tadqiq qilinadigan obyekt imkon qadar yaxlit holda aks etishi va qayta ishlanishi kerak.
Idrok etishning birinchi qadami - bu idrok etiladigan obyekt haqidagi gipotezani shakllantirishdan iborat. Gipoteza obyektning aprior modeli, konteksti va oldingi gopotezalarning natijalarini tekshirish asosida ham(«yuqoridan-quyiga» jarayoni), obyektni oldindan analiz qilish asosida ham(«quyidan - yuqoriga») shakllanishi mumkin. Ikkinchi qadam - idrok etishni chuqurlashtirish(gipotezani tekshirish). Bu holda obyektni ilgari surilgan gipoteza dorasida qoʻshimcha analizi amalga oshiriladi va toʻliq kuchni kontekst jalb qiladi.
Idrok etish qulay boʻlishi uchun obyektni oldindan qayta ishlashni amalga oshirish zarur. Lekin bu holda obyekt haqidagi ma’lumot yoʻqolmasligi kerak. Odatda obyektni boshlangʻich qayta ishlash kiruvchi obyektni keyingi ishlar uchun qulay boʻlgan tasavvurga almashtirishga olib kelinadi(masalan, tasvirni vektorlashtirish) yoki kiruvchi obyektning barcha mumkin boʻlgan segmentlash variantlarini olishga olib kelinadi va ularning ichidan gipotezalarni ilgari surish va tekshirish orqali toʻgʻrisi tanlanadi. Gipotezalarni oʻrtaga tashlash va tekshirish jarayoni dastur arxitekturasida yaqqol aks etishi lozim. Har bir gopoteza uni baholash yoki boshqasi bilan taqqoslash mumkin boʻlishi uchun obyekt boʻlishi kerak. Shuning uchun odatda gipotezalar ketma - ket ravishda oʻrtaga tashlanadi, shundan soʻng roʻyxatga birlashtiriladi va oldindan baholash orqali saralanadi. Gipotezani oxirgi tanlashda kontekst va boshqa qoʻshimcha bilimlar manbai faol ishtirok etadi.
Hozirgi kunda genetik dasturlash sohasidagi peshqadamlardan biri Stenford universitetida professor Djon Koza rahbarligadi ishlaydigan tadqiqotchilar guruhi hisoblanadi. Genetik dasturlash Djon Makkarti guruhi tomonidan roʻyxatlarni qayta ishlash va funksional dasturlash uchun moʻljallangan, allaqachon unutilgan LISP(List Processing) tiliga yangi hayot bagʻishladi. Aynan shu til AQShda sun’iy intellekt masalalalari uchun keng tarqalgan dasturlash tillaridan boʻlgan va boʻlib qolmoqda.
Hozirgi kunda belgilarni anglashda uchta yondashuv ma’lum - shablonli, strukturali va belgili. Lekin yaxlitlik tamoyiliga faqat birinchi ikkitasi javob beradi [11-15].
Shablonli tavsiflashni amalga oshirish uchun oson, ammo, strukturaliga qaraganda u, shakllarning turli - tumanligiga ega boʻlgan murakkab obyektlarni tavsiflash imkonini bermaydi. Aynan shuning uchun shablonli tavsiflash faqat bosma belgilarni anglash uchun, ayni vaqtda strukturali tavsiflash koʻproq shakl variantlariga ega qoʻlyozma belgilarni anglashda qoʻlaniladi.
Do'stlaringiz bilan baham: |