3. Konvolyutsion neyron tarmoqlari
Ushbu muammoning echimini tibbiyot sohasidagi Nobel laureatlari Torsten Nils Vizel va Devid Xubelning ishlari ilhomlangan frantsuz-amerikalik olim Yan LeKune topdi. Ushbu olimlar mushuk miyasining vizual korteksini o'rganib chiqdilar va turli xil burchaklarda to'g'ri chiziqlarga va reaktsiyalarning bir yo'nalishda harakatlanishiga javob beradigan murakkab hujayralarga qattiq reaktsiya qiladigan oddiy hujayralar deb ataldi. Yang LeCun, konvulsion neyron tarmoqlarini ishlatishni taklif qildi [2].
Konvulsion neyron tarmoqlarning g'oyasi konvolyutsion qatlamlar (C-qatlamlar), quyi qatlamlar (S-qatlamlar) va chiqishda F-qatlamlarining bo'lishidir.
Ushbu arxitektura uchta asosiy paradigmani o'z ichiga oladi:
1. Mahalliy idrok.
2. Umumiy vaznlar.
3. Downsampling.
Mahalliy idrok etish shuni anglatadiki, butun tasvir (yoki oldingi qavatning chiqishi) bitta neyronning kirishiga emas, balki uning ma'lum bir maydoniga tushadi. Ushbu yondashuv bizga rasmning topologiyasini qatlamdan qatlamga saqlashga imkon berdi.
Umumiy og'irliklar tushunchasi juda ko'p miqdordagi ulanishlar uchun juda oz miqdordagi og'irliklar to'plamidan foydalanilishini anglatadi. Bular agar biz kirishda 32x32 piksel o'lchamiga ega rasmga ega bo'lsak, unda keyingi qatlamning har bir neyroni kirish sifatida ushbu rasmning kichik bir qismini oladi, masalan, 5x5, va har bir bo'lak bir xil to'plamda qayta ishlanadi. Og'irliklar to'plamlarining o'zlari bo'lishi mumkinligini tushunish muhim, ammo ularning har biri butun tasvirga qo'llaniladi. Bunday to'plamlar ko'pincha yadro deb ataladi. Hisoblash oson, hatto 32x32 kirish tasvir uchun 10 5x5 yadrolar uchun ham ulanishlar soni taxminan 256000 (10 million bilan taqqoslang), sozlanishi parametrlar soni esa atigi 250 bo'ladi!
Siz nima deb o'ylaysiz, bu tan olish sifatiga ta'sir qiladimi? G'alati, yaxshisi uchun. Gap shundaki, tarozilarda bunday sun'iy ravishda kiritilgan cheklov tarmoqning umumlashtirish xususiyatlarini yaxshilaydi, natijada tarmoq boshqa rasmlarga e'tibor bermasdan, rasmda invariantlarni topish va asosan ularga javob berish qobiliyatiga ijobiy ta'sir ko'rsatadi. Ushbu yondashuvga biroz boshqacha burchakdan qarashingiz mumkin. Tasvirlarni tanib olish klassikasini o'rgangan va uning amalda qanday ishlashini (masalan, harbiy texnologiyada) bilganlar ushbu tizimlarning aksariyati ikki o'lchovli filtrlarga asoslanganligini bilishadi. Filtr odatda koeffitsientlarning matritsasi bo'lib, odatda qo'l bilan o'rnatiladi. Ushbu matritsa rasmga konvulsiya deb nomlangan matematik operatsiya yordamida qo'llaniladi. Ushbu operatsiyaning mohiyati shundan iboratki, rasmning har bir bo'lagi yig'ilish matritsasi (yadro) elementiga element bilan ko'paytiriladi va natija yig'ilgan va chiqish rasmidagi o'xshash pozitsiyaga yozilgan. Bunday filtrlarning asosiy xususiyati shundan iboratki, rasm bo'lagi filtrning o'zi kabi qanchalik ko'p ko'rinsa, ularning chiqishi shunchalik katta bo'ladi. Shunday qilib, ma'lum bir yadro bilan biriktirilgan rasm bizga boshqa tasvirni beradi, ularning har bir pikseli rasm fragmentining filtrga o'xshashlik darajasini ko'rsatadi. Boshqacha aytganda, bu xususiyat xaritasi bo'ladi.
Rasmda C qatlamida signal tarqalish jarayonini tasvirlashga harakat qildim:
Tasvirning har bir bo'lagi elementlarga ko'ra kichik o'lchamdagi matritsa (yadro) bilan ko'paytiriladi, natijada xulosa chiqariladi. Ushbu yig'indisi xususiyat xaritasi deb nomlangan chiqish rasmidagi pikseldir. Bu erda men ma'lumotlarning aniqlangan miqdori hali ham faollashtirish funktsiyasi orqali o'tayotganligini (boshqa neyron tarmoqlarida bo'lgani kabi) esdan chiqardim. Aslida, bu S-qatlamda ham sodir bo'lishi mumkin, ammo tubdan farq yo'q. Aytish kerakki, ideal ravishda turli xil bo'laklar yadrodan ketma-ket o'tmaydi, lekin parallel ravishda butun rasm bir xil yadrolar orqali o'tadi. Bundan tashqari, yadrolar soni (og'irliklar to'plami) ishlab chiqaruvchi tomonidan belgilanadi va qancha xususiyatlarni aniqlash kerakligiga bog'liq. Konvulsion qatlamning yana bir xususiyati shundaki, u chekka effektlar orqali tasvirni biroz pasaytiradi.
Tuzatish va S-qatlamlarning mohiyati tasvirning fazoviy o'lchamlarini kamaytirishdir. Bular kirish tasviri o'rtacha (o'rtacha) belgilangan vaqtga qisqartiriladi. Ko'pincha 2 marta, garchi notekis o'zgarishlar bo'lishi mumkin, masalan, vertikal va 3 gorizontal. Masshtab o'zgarmasligini ta'minlash uchun qismlarni yig'ish kerak.
Qatlamlarni o'zaro almashish xususiyati xaritalarini xususiyatli xaritalardan tuzish imkonini beradi, bu amalda murakkab xususiyatlar ierarxiyasini tan olish imkoniyatini anglatadi.
Odatda, bir necha qatlamlardan o'tib, xususiyat xaritasi vektorga yoki hatto skalaga tushadi, ammo yuzlab bunday xaritalar mavjud. Ushbu shaklda ular to'liq ulangan tarmoqning bir yoki ikki qatlamiga oziqlanadi. Bunday tarmoqning chiqish qatlami turli xil faollashtirish funktsiyalariga ega bo'lishi mumkin. Eng oddiy holatda, u tangensial funktsiya bo'lishi mumkin, radial asos funktsiyalari ham muvaffaqiyatli ishlatiladi.
Do'stlaringiz bilan baham: |