Kompyuter ko'rish
Buni kompyuter ko'rish qobiliyatiga qo'llashni o'rganishdan oldin - umuman olganda, u yo'q edi. Agar biror narsa bo'lsa, u hozirgidek ishlamadi.
Biz bu xususiyatlarning barchasini neyron tarmog'iga o'tkazamiz va hozir u ishlaydi, agar siz ma'lumotlar to'plamiga kichik burilish kiritmasangiz, men bu haqda keyinroq gaplashaman.
Lekin birinchi navbatda, eng oddiy pertsepton haqida. U ham bizning miyamizning qiyofasida va o'xshashligida shakllanadi. Miya hujayrasiga o'xshash eng oddiy element - bu neyron. Sukut bo'yicha chapdan o'ngga, ba'zan pastdan yuqoriga qarab ishlaydigan kirish elementlari mavjud. Chapda neyronning kirish qismlari, o'ngda neyronning chiqish qismlari joylashgan.
Eng oddiy pertsepton faqat eng oddiy operatsiyalarni bajarishga qodir. Keyinchalik murakkab hisob -kitoblarni amalga oshirish uchun bizga yashirin qatlamlari ko'p bo'lgan tuzilma kerak.
Kompyuterni ko'rish holatida, biz undan ham ko'proq yashirin qatlamlarga muhtojmiz. Va shundagina tizim ko'rganlarini aql bilan taniy oladi.
Shunday qilib, tasvirni aniqlash paytida nima sodir bo'lishini men sizga yuzlar misolida aytib beraman.
Biz bu rasmga qarab, haykalning yuzi tasvirlangan deyishimiz juda oddiy. Biroq, 2010 yilgacha, bu kompyuterni ko'rish uchun nihoyatda qiyin vazifa edi. Bu masala bilan shu paytgacha shug'ullanganlar, rasmda biz topmoqchi bo'lgan ob'ektni so'zsiz tasvirlash qanchalik qiyin bo'lganini bilishadi.
Biz buni qandaydir geometrik usulda bajarishimiz, ob'ektni tasvirlashimiz, ob'ektning o'zaro munosabatini, bu qismlar bir -biriga qanday aloqasi borligini tasvirlashimiz kerak edi, keyin bu tasvirni ob'ektdan topib, ularni solishtirib, yomon tan olganimizni olishimiz kerak edi. Bu odatda tanga tashlashdan ko'ra yaxshiroq edi. Tasodif darajasidan biroz yaxshiroq.
Hozir bunday emas. Biz o'z rasmimizni piksellarga yoki bir nechta yamoqlarga ajratamiz: 2x2, 3x3, 5x5, 11x11 piksel - bu neyron tarmoqqa kirish qatlami sifatida xizmat qiladigan tizim yaratuvchilari uchun qulay.
Ushbu kirish qatlamlaridan signallar qatlamdan qatlamga sinaps yordamida uzatiladi, har bir qatlam o'ziga xos koeffitsientlarga ega. Shunday qilib, biz yuzni tanigunimizcha qatlamdan qatlamga, qatlamdan qatlamga o'tamiz.
An'anaga ko'ra, bu qismlarni uchta sinfga bo'lish mumkin, biz ularni X, W va Y deb belgilaymiz, bu erda X - bizning kirish tasvirimiz, Y - teglar to'plami va biz o'z vaznimizni olishimiz kerak. W ni qanday hisoblaymiz?
Bizning X va Y bilan hamma narsa oddiy ko'rinadi. Biroq, yulduzcha bilan ko'rsatilgan narsa, afsuski, teskari yo'nalishga ega bo'lmagan juda murakkab chiziqli bo'lmagan operatsiya. Tenglamaning berilgan 2 ta komponenti bo'lsa ham, uni hisoblash juda qiyin. Shuning uchun, biz asta -sekin, sinov va xato bilan, V vaznini tanlab, xato iloji boricha kamayishi uchun, yaxshisi nolga teng bo'lishimiz kerak.
Bu jarayon ketma -ket sodir bo'ladi, biz o'zimizga mos keladigan V vaznining qiymatini topmagunimizcha doimo kamayamiz.
Aytgancha, men ishlagan bitta neyron tarmoq ham nolga teng xatoga erishmagan, lekin u juda yaxshi ishlagan.
Bu erda 2012 yilda ImageNet xalqaro tanlovida g'olib bo'lgan birinchi tarmoq. Bu AlexNet deb nomlangan. Bu konvulsion mavjudligini birinchi bo'lib e'lon qilgan tarmoq neyron tarmoqlari va shundan beri konvulsion neyron tarmoqlar hech qachon barcha xalqaro musobaqalarda o'z pozitsiyalaridan voz kechmagan.
Bu tarmoq juda kichik bo'lishiga qaramay (bor -yo'g'i 7 ta yashirin qatlam), unda 60 million parametrli 650 ming neyron mavjud. To'g'ri vaznni qanday topish kerakligini takror -takror o'rganish uchun bizga ko'plab misollar kerak.
Neyron tarmoq rasm va yorliq misolidan o'rganadi. Bizga bolalikdan "bu mushuk va bu it" deb o'rgatishganidek, neyron tarmoqlar ham ko'plab rasmlarga o'rgatilgan. Ammo haqiqat shundaki, 2010 yilgacha tasvirni tanib olish uchun bunday parametrlarni o'rgatadigan etarlicha katta ma'lumotlar to'plami yo'q edi.
Bu vaqtgacha mavjud bo'lgan eng yirik ma'lumotlar bazalari: PASCAL VOC, atigi 20 toifali ob'ektlar va Kaliforniya Texnologiya Institutida ishlab chiqilgan Caltech 101. Ikkinchisi 101 toifaga ega edi va bu juda ko'p edi. Ma'lumotlar bazasining birortasida o'z ob'ektlarini topa olmaganlar o'z ma'lumotlar bazalariga qimmatga tushishi kerak edi, men aytaman, bu juda og'riqli.
Biroq, 2010 yilda ImageNet ma'lumotlar bazasi paydo bo'ldi, unda 22 million toifaga bo'lingan 15 million tasvir bor edi. Bu bizning neyron tarmoqlarini o'qitish muammosini hal qildi. Endi akademik manzilga ega bo'lgan har bir kishi baza saytiga bemalol kirishi, ruxsat so'rashi va neyron tarmoqlarini o'rgatish uchun ushbu bazani olishi mumkin. Ular etarlicha tez javob berishadi, menimcha, ertasi kuni.
Oldingi ma'lumotlar to'plamiga qaraganda, bu juda katta ma'lumotlar bazasi.
Misol, undan oldin bo'lganlarning qanchalik ahamiyatsiz ekanligini ko'rsatadi. ImageNet bazasi bilan bir vaqtda ImageNet musobaqasi paydo bo'ldi, unda xalqaro musobaqada qatnashmoqchi bo'lgan barcha jamoalar qatnashishi mumkin.
Bu yil Xitoyda yaratilgan tarmoq g'alaba qozondi, uning 269 qatlami bor edi. Men qancha parametrlarni bilmayman, menimcha, ular juda ko'p.
Do'stlaringiz bilan baham: |