ЎЗБЕКИСТОН РЕСПУБЛИКАСИ АХБОРОТ ТЕХНОЛОГИЯЛАРИ ВА КОММУНИКATSIЯЛАРИНИ РИВОЖЛАНТИРИШ ВАЗИРЛИГИ МУҲАММАД АЛ-ХОРАЗМИЙ НОМИДАГИ ТОШКЕНТ АХБОРОТ ТЕХНОЛОГИЯЛАРИ УНИВЕРСИТЕТИ
Мустақил иш
Convolutional Neural
Bajardi: Qo’chqorov Sh. X
Guruh: 010-18 SAX
Fan: Biznes jarayonlarini boshkarish
Tekshirdi: Arabboyev M.M.
Тошкент – 2022
Kirish
Ob'ektni tanib olishning hozirgi yondashuvlari mashinani o'rganish usullaridan muhim foydalanadi. Ularning ishlashini isbotlash uchun biz kattaroq ma'lumotlar to'plamini to'plashimiz, kuchliroq modellarni o'rganishimiz va haddan tashqari moslashishning oldini olish uchun eng yaxshi usullardan foydalanishimiz mumkin. Yaqin vaqtgacha etiketli tasvirlarning ma'lumotlar to'plami nisbatan edi
kichik - o'n minglab tasvirlar tartibida (masalan, NORB [16], Caltech-101/256 [8, 9] va
CIFAR-10/100 [12]). Oddiy tanib olish vazifalari bunday o'lchamdagi ma'lumotlar to'plami bilan juda yaxshi hal qilinishi mumkin,
ayniqsa, agar ular yorliqni saqlaydigan transformatsiyalar bilan to'ldirilgan bo'lsa. Misol uchun, MNIST raqamli tanib olish vazifasidagi joriy eng yaxshi xato darajasi (<0,3%) inson faoliyatiga yaqinlashadi [4].
Ammo real sharoitlarda ob'ektlar sezilarli darajada o'zgaruvchanlikni namoyish etadi, shuning uchun ularni tanib olishni o'rganish kerak
ancha katta o'quv majmualaridan foydalanish kerak. Va haqiqatan ham, kichik tasvir ma'lumotlar to'plamining kamchiliklari
keng e'tirof etilgan (masalan, Pinto va boshq. [21]), lekin yaqinda millionlab tasvirlar bilan etiketlangan ma'lumotlar to'plamini to'plash mumkin bo'ldi. Yangi kattaroq ma'lumotlar to'plamlari LabelMe [23] ni o'z ichiga oladi
yuz minglab toʻliq segmentlangan tasvirlardan va ImageNet [6] dan iborat
22 000 dan ortiq toifadagi 15 milliondan ortiq yuqori aniqlikdagi tasvirlar.
Millionlab tasvirlardan minglab ob'ektlar haqida bilish uchun bizga katta o'rganishga ega model kerak
sig'im. Biroq, ob'ektni tanib olish vazifasining juda murakkabligi shuni anglatadiki, bu muammoni hatto ImageNet kabi katta ma'lumotlar to'plami tomonidan ham aniqlab bo'lmaydi, shuning uchun bizning modelimiz ham ko'p bo'lishi kerak.
Bizda mavjud bo'lmagan barcha ma'lumotlarning o'rnini qoplash uchun oldingi bilimlar. Konvolyutsion neyron tarmoqlari
(CNN) ana shunday modellar sinfini tashkil qiladi [16, 11, 13, 18, 15, 22, 26]. Ularning imkoniyatlari chuqurligi va kengligini o'zgartirish orqali boshqarilishi mumkin, shuningdek, ular kuchli va asosan to'g'ri taxminlar qiladilar.
tasvirlarning tabiati haqida (masalan, statistik ma'lumotlarning statsionarligi va pikselga bog'liqliklarning joylashuvi).
Shunday qilib, xuddi shunday o'lchamdagi qatlamlarga ega standart oldinga yo'naltirilgan neyron tarmoqlari bilan solishtirganda, CNNlar mavjud
ancha kamroq ulanishlar va parametrlar va shuning uchun ularni o'qitish osonroq bo'ladi, lekin ular nazariy jihatdan eng yaxshisidir
unumdorligi biroz yomonroq bo'lishi mumkin.
Do'stlaringiz bilan baham: |