4.4. Vizual naqshni aniqlash
va maxsus raqamli va analogni qo'llash
manipulyatorning harakatini muvofiqlashtirish tizimi o'qitilishi mumkin
ko'z-qo'l) qo'llab-quvvatlash signallarini avtomatik yaratish bilan
Video ma'lumot eng muhim hissiy ma'lumotdir
tan olish va nazorat qilish, shu jumladan evolyutsion rivojlanish
va videokameradan olingan ma'lumotlarga ko'ra ob'ektlarni uzatish (tizim
turli xil xotira turlari uchun neyron tarmoq mexanizmlarini amalga oshirish;
sun'iy intellekt tizimlari, chunki ular urinishdir
ob'ekt va tutqich. Amalga oshirish uchun kengroq dastur
asoslangan aqlli robotlarning insonga o'xshash murakkab xatti-harakatlari
nisbiy pozitsiyaning parametrlarini hisoblash asosida qo'lga olish
Shunga o'xshash neyromorfik tizimlar uchun eng qiziqarli
xulq-atvor xususiyatlari. Bu kelajakda amalga oshirish imkonini beradi
140
Machine Translated by Google
ma'lumotlarni kiritish. Keyin u aylantiriladi
va ularning qismlari, chunki u tirik dunyoda amalga oshiriladi. Bunga yechim
tirik mavjudotlar, shu jumladan tezlik jihatidan, birinchi navbatda
muammolarni hal etish, xususan, yaratish yo‘lidagi dolzarb vazifadir
- tan olish amalga oshiriladigan xususiyatlarni tanlash
ma'lumot vizual naqshni aniqlash muammosi bilan yaxshi tasvirlangan. Yuqorida aytib
o'tilganidek, zamonaviy
standart bilan taqqoslash va boshqalar. Olomon, bulut, kirpi va boshqalar kabi shunga
o'xshash narsalar uchun. tasvirni ko'rsatish va tanib olishning muqobilligi yo'q. Muammoning
to'liq echimi tasvirlarning ierarxik assotsiativ xotirasiga asoslangan ko'rish tizimlarini yaratish
bo'ladi.
ko'rish tizimlari ko'rish tizimlaridan pastroqdir
– dastlabki sensorli axborotni dastlabki qayta ishlash;
Birinchi bosqich birinchi navbatda filtrlash va raqamlashtirishni o'z ichiga oladi
majoziy ma'lumotni dastlabki o'zgartirish bo'yicha
uning yechimi bilan hozirgi vaziyat. Ayni paytda shuni ta'kidlaymiz
ism;
yangi avlod robotlari - aqlli robotlar. O'ylab ko'ring
chunki ularning naqshni aniqlash algoritmlari asoslanadi
og'zaki belgilar. Shubhasiz, bu erda "o'lchovlilik la'nati" muqarrar
ravishda paydo bo'ladi, chunki tasvir qanchalik murakkab bo'lsa, ushbu
xususiyatlar va muvofiqlik makonining o'lchovliligi shunchalik katta bo'ladi.
- asl tasvirni tan olish to'g'risida qaror qabul qilish.
- tovush, hid, ta'm.
kosmosda keyinchalik tan olinishi bilan og'zaki ichiga
vaziyat boshqa turdagi murakkab tasvirlar bilan o'xshash.
uning asosiy modelini yaratish. obrazli nuqtai nazar
majoziy shaklda tan olishga qaytish - jinoyatchining "identifikiti", bosma platalarning sifatini
nazorat qilish
quyidagi bosqichlarni o'z ichiga oladi:
Mas'uliyatli tarzda, tan olish jarayoni yanada murakkab va uzoqroq.
Shuning uchun, etarlicha murakkab tasvirlarga ega bo'lish muqarrar
dunyoning majoziy tasvirining asosi, bunda
An'anaviy naqshni aniqlash protsedurasi
141
Machine Translated by Google
- oqim xususiyatlarini bog'laydigan grafiklarni taqqoslash
ob'ekt shaklini tavsiflovchi geometrik xususiyatlardan foydalanishdir.
Lekin nafaqat shakl xarakterlaydi
rasm va shablonlar;
og'zaki belgilar makoniga an'anaviy o'tish o'rniga, qismlar shaklida
majoziy belgilardan foydalanish kerak.
- xususiyat maydonida ma'lum bir sinfni tavsiflovchi eng yaqin
shablonni topish;
asl tasvir. Vizual tasvirlar uchun eng aniq
ularning ifodalari. Majoziy tan olish bilan bir qatorda og'zaki tan olish
elementlari ham qo'llaniladi. Tizimlarda
tasvirlarni komponentlarga aylantiradi [16].
ierarxik assotsiativ xotira;
- mos keladiganlarga asoslangan tasvirning alohida qismlarini
tasniflagichlar to'plamidan foydalangan holda ierarxik tasniflash
turli tasvirlar va ularning qismlari, masalan, odamning yuzi, mebellari,
oziq-ovqatlari. Integralning parchalanishiga turlicha yondashuvlar
ma'lum bir sinfga tegishli, buning uchun
Oldingi paragraflardan ko'rinib turibdiki, maxsus istiqbol - bu neyron
tarmoqlar yordamida naqshni aniqlashning so'nggi versiyasi. Buning
uchun turli xil variantlar taklif qilingan
Nihoyat, naqshni tanib olish to'g'risida qaror qabul qilishning yakuniy
bosqichi uning identifikatsiyasi (standartga muvofiq) yoki ta'rifidir.
– ierarxik neyron tarmoqlardan foydalanish.
tan olish jarayonining keyingi bosqichi. Bu bosqichda
– joriy tasvirning geometrik belgilari ro‘yxatini ularning shablonlari
(standartlari) bilan solishtirish;
tasvir turlari, jumladan, qo'lda yozilgan matnlar, inson yuzlari va hatto
quyidagi usullar:
keyingi xususiyatni ajratib olish uchun qulay shaklga, masalan, afin
transformatsiyasi (ob'ektlarning siljishi va aylanishi), Hough
transformatsiyasi (alohida ob'ektlar va ularning qismlarini tanlash) va
boshqalar. Xususiyatlarni ajratib olish eng muhim, hatto juda muhim
Turli xillarni tanib olish va tasniflash uchun ko'p qatlamli tarmoqlar
142
Machine Translated by Google
robotning sun'iy intellekt tizimidagi vizual ma'lumotlar. Keling, kognitron,
neokognitron va piramidal neyron tarmog'ida vizual ma'lumotlar qanday
qayta ishlanishini batafsil ko'rib chiqaylik.
oxirgi qatlamning har bir neyroni namunaning sinfini aniqlaydi [17].
Konvolyutsion neyron tarmoq mahalliy tarmoqlardan iborat,
tarmoqlar.
maymun miyasining vizual qismi. Ushbu ko'p qatlamli tarmoqlarda tobora
ko'proq siqilgan majoziy
asl ikki o'lchovli tasvirning namoyishi va chiqish
vizual tasvirlarni bevosita idrok etish va obrazli idrok etish jarayonlarini
samarali modellashtirish imkonini beradi
qo'zg'atuvchi va inhibitiv neyronlar. Qo'zg'atuvchi neyronlar
asl tasvirning tegishli komponentlarini umumlashtirishning bir xil ketma-
ket tartibi amalga oshiriladi [18]. Piramidal neyron tarmog'i birinchisida
tasvirlanganni takrorlaydi
turli darajadagi umumlashtirishni amalga oshiradigan bir necha qatlamlardan.
Har bir qatlamning neyroni cheklangan miqdordagi neyronlar bilan bog'langan
Kognitron, xuddi inson miyasining vizual korteksi kabi, quyidagilardan iborat
retseptiv sohaning alohida qismlarini aks ettiruvchi, unda
sof majoziy ma'noda. Bu erda asl pikselli tasvirga topologik bog'lanish
ham qatlamlarda saqlanadi va chiqish qatlamining har bir neyroni ma'lum
bir narsani ifodalaydi.
neyron tarmoqning barcha kirish (reseptiv) maydoniga javob beradi, ochib beradi
tanib olishni amalga oshiradigan inson ko'rish korteksining parallel
ierarxik piramidal tuzilishining boshi
oldingi qatlam (ulanish maydoni) va chiqish qatlamida har bir
Berilgan neyron tarmoqlar misollari ixtisoslashgan
neyron tarmoq. Kognitron va neokognitron modellashtirilgan
Kognitron qatlamlari, xuddi tabiiy neyron tarmog'i kabi, o'z ichiga oladi
tasvirlar sinfi [19].
To'liq majoziy tanib olish uchun asl pikselli tasvir topologik jihatdan qaror
qabul qilishning yakuniy bosqichiga qadar saqlanadi. Bunday tizimlarga
misollar: kognitron, neokognitron, konvolyutsion neyron tarmoq, piramidal.
alohida rasm.
143
Machine Translated by Google
va kirish qatlami tomonidan qabul qilingan ushbu tasvirning ko'lami.
Neokognitronning har bir qatlami ikkita tekislikdan iborat. Birinchidan
ulanishlar.
samolyotda signallarni qabul qiluvchi oddiy neyronlar mavjud
ularning vaznini belgilash tartiblari. Masalan, kirish qatlami turli
yo'nalishdagi chiziq segmentlarini tanib olish uchun tuzilgan,
bu hayajon. Qo'zg'atuvchi neyron chiqishining qiymati qo'zg'atuvchi va
inhibitiv kirishlarning vaznli yig'indisi nisbati bilan belgilanadi. Kognitron
o'qituvchisiz o'rganadi. O'rganayotganda
tarmoq vazn koeffitsientlarini o'zgartirish orqali o'zini o'zi tashkil qiladi
uning tasvirini pozitsiyaga, orientatsiyaga o'zgarmasligini tan oladi
Har bir qatlamning neyronlarining chiqish qiymatlari va odatdagidan foydalaniladi
kognitron g'oyasini rivojlantiradi, shuningdek, ko'p qatlamli ierarxik
tuzilishga ega. Kognitron bilan solishtirganda, u ko'proq
tasvirlar, keyinchalik ikkinchi tekislikning murakkab neyronlariga
oziqlanadi, bu erda tasvirlar tasvirdagi pozitsiyasiga kamroq bog'liqlikni
ta'minlash uchun qayta ishlanadi. Har birining retseptiv maydoni
va keyingi qatlamlar - burchaklar kabi komponentlarni tanib olish uchun
oldingi qatlamning murakkab neyronlaridan va ma'lum ajratadi
Shaklda. 4.2 da neokognitron diagrammasi ko'rsatilgan. neokognitron
tizim kiritilgan ma'lumotlar turiga bog'liq emas. Kiritish
mos ravishda kamayadi.
universal bo'lib, vizual axborotni qayta ishlash uchun ham,
umumlashtirilgan tan olish sifatida ham qo'llaniladi
neyron qatlamdan qatlamga ko'payadi va qatlamdagi neyronlar soni
keyingi qatlamning neyroni va inhibitor neyronlar neytrallanadi
qayta ishlash, uning natijalari ikkinchi qatlamga o'tkaziladi va hokazo.
naqsh tan olingan oxirgi chiqish qatlamiga yetguncha. Oxirgi chiqish
qatlamida har bir neyron
va o'qituvchi bilan. Bunday holda, talab qilinadi
tasvir neokognitronning birinchi qatlamiga oziqlanadi, u erda u o'tadi
bir qatlamning faollashishi ularga ulangan qatlamning faollashishiga olib keladi
Neokognitron, xuddi kognitron kabi, o'qituvchisiz o'qitiladi.
Neokognitronni o'rgatish imkoniyati mavjud
144
Machine Translated by Google
Gu
r
u
ch
.
4
.2
.
N
e
o
ko
g
n
i
tr
o
n
d
i
a
g
r
a
m
m
a
si
145
Machine Translated by Google
146
tasvirlarning fazoviy topologiyasi. Shaklda. 4.3 diagrammani ko'rsatadi
xususiyatni ajratib olish va bir tuzilishda tasniflash, shuningdek
Piramidal neyron tarmog'i Pyranet (Pyramidal Neural Network)
shuningdek, pikselli tasvirlarni qayta ishlash, tasvirni segmentatsiyalash
va siqish, shuningdek vizual naqshni aniqlash muammolarini hal qilishi
mumkin. Tarmoq 2D neyron tarmoqlarining ayrim xususiyatlariga ega,
jumladan, bosqichlarni birlashtirish
va chiqish qatlamiga ega bo'lgunga qadar turli pozitsiyalarda,
yo'nalishlarda va masshtablarda ortib borayotgan murakkablikning yopiq raqamlari
piramidal neyron tarmog'i.
ikki o'lchovli ushlab turish uchun qabul qiluvchi maydonlardan foydalanish
kerakli tasvir yaratiladi.
Guruch. 4.3. Piramidal neyron tarmog'ining sxemasi
Machine Translated by Google
1D qatlamlarda xususiyatlar tasnifi. Oxirgi 1D qatlamining 1D
neyronlarining chiqishlari toifalarni ifodalovchi chiqishlardir
2D qatlam 1D tekis qatlamlar bilan bog'langan. 2D piramidal uzoq
qatlam 2D shaklida tashkil etilgan neyronlardan iborat
rasmlarni kiritish.
yangi tasvir, chiqishlar tasniflashni ta'minlaydi
(2D) piramidal qatlamlar va bir o'lchovli (1D) tekis
qatlamlar. Birinchi 2D qatlam kirish tasvirlari bilan aloqa qiladi va keyin
bir yoki bir nechta 2D qatlamlarga ulanadi. Oxirgi
murakkab yechimlarni shakllantirishni o'z ichiga oladi. 2D xususiyatni
olish uchun piramidalardan foydalanish vazifani soddalashtiradi
regressiya va interpolyatsiya masalalarida foydalaniladi. COEX orqali
neyron tarmoqni o'rganayotganda, tarmoq taqdim etilganda
oldingi qatlamdagi to'rtburchaklar qabul qiluvchi maydon. Uchun
vizual tanib olishning turli vazifalari. O'rganish maqsadi - tomonidan
aniqlanadigan xato funktsiyasini iterativ ravishda kamaytirishdir
to'g'ridan-to'g'ri tasvir. A'zolik bo'lsa, ko'rsatilgan
Pyranet neyron tarmog'ini hal qilishga o'rgatish mumkin
massiv. Ushbu qatlamning har bir neyroni ma'lum biriga bog'langan
retseptorlari maydonidan chiqishlarning vaznli yig'indisini bo'linadi va keyin
maqsadli sinfga deterministik sifatida belgilanishi mumkin
tarmoqni o'qitishga yondashuv. Birinchi yondashuv tarmoqdan
diskriminant funktsiyasining o'zini ifodalash uchun foydalanadi, ikkinchi
yondashuv esa modellash uchun tarmoqdan foydalanadi
Ushbu neyron ikki o'lchovli (2D neyron) qilingan va aniqlashga qodir
ushbu ilova uchun kerakli natijalar. Ikkita bor
tasvirni qayta ishlashning ikki turini o'z ichiga oladi - ikki o'lchovli
chiqish signali. 1D tekis qatlamlarning roli 2D piramidal qatlamlar
tomonidan ishlab chiqarilgan xususiyatlarni qayta ishlashdan iborat.
Bunday tizimlarda bir nechta 1D qatlamlari kerak bo'lishi mumkin
o'rtacha kvadrat xato (RMS). Bu xususiyat odatda
olish uchun chiziqli bo'lmagan faollashtirish funktsiyasini qo'llang
Pyranet ierarxik qatlamli tuzilishga ega
sinflarga mansublikning posterior ehtimoli. Shunga ko'ra, standart xato
funktsiyasidan foydalanish mumkin
147
Machine Translated by Google
tasvirlar, shuningdek, vizual tasvirlarni tanib olish. Net
Ta'riflangan piramidal neyron tarmog'i sinovdan o'tkazildi
ikki o'lchovli neyron tarmoqlarning imkoniyatlariga ega, shu jumladan
xususiyatlarni ajratib olish va tasniflash bosqichlarini birlashtirish
Til axborotning og'zaki vositasini anglatadi
bunday xato funktsiyasi, masalan, protsedura yordamida
gradient tushish.
tarmoq shuningdek pikselli tasvirlarni qayta ishlash, parchalanish,
segmentatsiya va siqish muammolarini samarali hal qilishi mumkin
Do'stlaringiz bilan baham: |