To'liq ulangan neyron tarmoqlari uchun tarmoqning arxitekturasini aniqlaydigan uchta muhim savol mavjud:
Nechta qatlam bor?
Ushbu qatlamlarning har birida nechta tugun bor?
Ushbu qatlamlarning har birida qanday uzatish / aktivlashtirish funktsiyasi qo'llaniladi?
Ushbu maqolada ushbu savollarning birinchi ikkitasi, uchinchisi esa keyingi maqolada ko'rib chiqiladi. O'tkazish / faollashtirish funktsiyasining harakati gradientning tushishi va orqaga qaytish bilan chambarchas bog'liq, shuning uchun mavjud variantlarni muhokama qilish ushbu seriyadagi keyingi maqoladan keyin ko'proq ma'no beradi. Neyron tarmoqlarni amaliy vazifalarda qo'llashda bir qator muammolar yuzaga keladi. Birinchidan, xaritani etarlicha aniq amalga oshirish uchun tarmoq qanday murakkablik (hajm) talab qilishi mumkinligi oldindan ma'lum emas. Ushbu murakkablik taqiqlovchi bo'lishi mumkin va murakkab tarmoq arxitekturasini talab qiladi. Shunday qilib, Minskiy "Pertseptronlar" asarida eng oddiy bir qavatli neyron tarmoqlari faqat chiziqli bo'linadigan masalalarni echishga qodir ekanligini isbotladi. Ushbu cheklovni ko'p qatlamli neyron tarmoqlari yordamida bartaraf etish mumkin. Umuman olganda aytishimiz mumkinki, bitta yashirin qatlamga ega bo'lgan tarmoqda kirish naqshiga mos keladigan vektor yashirin qatlam tomonidan boshqa o'lchamga ega bo'lishi mumkin bo'lgan ba'zi bir yangi maydonga aylantiriladi va keyin chiqish qatlamining neyronlariga mos keladigan giperplaneslar uni sinflarga ajratadi. Shu tarzda, tarmoq nafaqat asl ma'lumotlarning xususiyatlarini, balki yashirin qatlam tomonidan hosil bo'lgan "xususiyat xususiyatlarini" ham taniydi.
Tasniflagichni yaratish uchun namunaning qaysi sinfga tegishli ekanligi to'g'risida qarorni qanday parametrlarga ta'sir qilishini aniqlash kerak. Bu ikkita muammoga olib kelishi mumkin. Birinchidan, agar parametrlar soni oz bo'lsa, unda bir xil dastlabki ma'lumotlar to'plami turli sinflardagi misollarga mos keladigan vaziyat yuzaga kelishi mumkin. Keyin neyron tarmog'ini o'rgatish mumkin emas va tizim to'g'ri ishlamaydi (bunday dastlabki ma'lumotlarning to'plamiga mos keladigan minimalni topish mumkin emas). Dastlabki ma'lumotlar izchil bo'lishi kerak. Ushbu muammoni hal qilish uchun xususiyatlar maydonining o'lchamini oshirish kerak (namunaga mos keladigan kirish vektorining tarkibiy qismlari soni). Ammo xususiyatlar maydonining kattalashishi bilan, misollar soni tarmoqni o'qitish uchun etarli bo'lmasligi mumkin bo'lgan vaziyat paydo bo'lishi mumkin va umumlashtirish o'rniga u shunchaki mashg'ulotlar to'plamidagi misollarni eslab qoladi va to'g'ri ishlay olmaydi. Shunday qilib, xususiyatlarni aniqlashda ularning soni bilan murosaga kelish kerak.
Shakl: 1.1. Yashirin neyronlarning 4 qatlami bo'lgan neyron tarmoq