Amaliy matematika” yo‘nalishi 21. 08-guruh talabasi Mamasodiqova Mubina Sattorali qizining



Download 5,25 Mb.
bet11/31
Sana05.05.2023
Hajmi5,25 Mb.
#935606
1   ...   7   8   9   10   11   12   13   14   ...   31
Bog'liq
mubiw

J(V,b)=[1mmi=1J(V,b;x(i),y(i))]+l2nl−1∑l=1sli=1sl+1∑j=1(V(l)ji)2=[1mmi=1(12‖hV,b(x(i))−y(i)‖2)]+l2nl−1∑l=1sli=1sl+1∑j=1(V(l)ji)2
ning ta'rifidagi birinchi atamaJ(V,b)oʻrtacha kvadratlar yigʻindisi xato atamasi. Ikkinchi atama - tartibga solish atamasi ( vaznni pasaytirish atamasi deb ham ataladi) og'irliklar hajmini kamaytirishga intiladi va ortiqcha moslashishning oldini olishga yordam beradi.
(Eslatma: Odatda vaznning pasayishi noto'g'ri atamalarga qo'llanilmaydi
b(l)iuchun ta'rifimizda aks ettirilgan J(V,b).
Og'irlikni pasaytirishni tarafkashlik birliklariga qo'llash odatda yakuniy tarmoqqa ozgina farq qiladi. Agar siz Stenfordda CS229 (Machine Learning) dasturini olgan bo'lsangiz yoki YouTube'da kurs videolarini tomosha qilgan bo'lsangiz, siz ushbu vaznning pasayishini o'zingiz ko'rgan Bayes regulizatsiya usulining bir varianti sifatida ham tan olishingiz mumkin, bu erda biz parametrlar va parametrlarga Gaussni qo'yganmiz. MAP (maksimal ehtimollik o'rniga) taxmin qildi.)
Og'irlikni pasaytirish parametri ikki atamaning nisbiy ahamiyatini nazorat qiladi. Bir oz ortiqcha yuklangan belgiga ham e'tibor bering: J(V,b;x,y)bitta misolga nisbatan xatoning kvadrat qiymati; J(V,b)umumiy xarajat funktsiyasi bo'lib, u vaznning yemirilish muddatini o'z ichiga oladi.
Yuqoridagi ushbu xarajat funktsiyasi ko'pincha tasniflash uchun ham, regressiya muammolari uchun ham qo'llaniladi. Tasniflash uchun biz ruxsat beramiz y=0 yoki 1 ikkita sinf yorlig'ini ifodalaydi (esda tutingki, sigmasimon faollashtirish funktsiyasi qiymatlarni chiqaradi[0,1]; Agar biz tanhni faollashtirish funksiyasidan foydalansak, biz teglarni belgilash uchun -1 va +1 dan foydalanamiz). Regressiya bilan bog'liq muammolar uchun biz birinchi navbatda natijalarimizni ularning ichida bo'lishini ta'minlash uchun kengaytiramiz[0,1]diapazon (yoki agar biz tanh faollashtirish funksiyasidan foydalanayotgan bo'lsak, u holda[−1,1]diapazon).
Bizning maqsadimiz minimallashtirishdir J(V,b) funktsiyasi sifatida V va b
Neyron tarmog'imizni o'rgatish uchun biz har bir parametrni ishga tushiramizV(l)ijva har birib(l)inolga yaqin kichik tasodifiy qiymatga (aytaylik, aNormal(0,s2)ba'zi kichiklar uchun tarqatishs, demoq0,01), so'ngra ommaviy gradient tushishi kabi optimallashtirish algoritmini qo'llang. beriJ(V,b)qavariq bo'lmagan funksiya bo'lib, gradient tushishi mahalliy optimaga sezgir; ammo, amalda gradient tushish odatda juda yaxshi ishlaydi. Nihoyat, barcha 0 larga emas, balki parametrlarni tasodifiy boshlash muhimligini unutmang. Agar barcha parametrlar bir xil qiymatlarda boshlangan bo'lsa, unda barcha yashirin qatlam birliklari kirishning bir xil funktsiyasini o'rganishni tugatadi (aniqroq qilib aytganda,V(1)ijning barcha qiymatlari uchun bir xil bo'ladii, Shuning uchun; ... uchun; ... natijasidaa(2)1=a(2)2=a(2)3=…har qanday kirish uchunx). Tasodifiy ishga tushirish simmetriyani buzish maqsadiga xizmat qiladi .
Gradient tushishning bir iteratsiyasi parametrlarni yangilaydiV,bquyida bayon qilinganidek:
V(l)ij=V(l)ija∂∂V(l)ijJ(V,b)b(l)i=b(l)ia∂∂b(l)iJ(V,b)
qayerdaao'rganish darajasi hisoblanadi. Asosiy qadam yuqoridagi qisman hosilalarni hisoblashdir. Endi biz bu qisman hosilalarni hisoblashning samarali usulini beradigan orqaga tarqalish algoritmini tasvirlaymiz .
Biz birinchi navbatda hisoblash uchun orqaga tarqalishdan qanday foydalanish mumkinligini tasvirlaymiz∂∂V(l)ijJ(V,b;x,y)va∂∂b(l)iJ(V,b;x,y), xarajat funktsiyasining qisman hosilalariJ(V,b;x,y)bitta misol bo'yicha aniqlanadi(x,y). Bularni hisoblab chiqqandan so'ng, biz umumiy xarajatlarning hosilasi funktsiyasini ko'ramizJ(V,b)quyidagicha hisoblash mumkin:
∂∂V(l)ijJ(V,b)=[1mmi=1∂∂V(l)ijJ(V,b;x(i),y(i))]+lV(l)ij∂∂b(l)iJ(V,b)=1mmi=1∂∂b(l)iJ(V,b;x(i),y(i))
Yuqoridagi ikkita chiziq biroz farq qiladi, chunki vaznning parchalanishi qo'llaniladiVlekin emasb.
Orqaga tarqalish algoritmi ortidagi sezgi quyidagicha. Trening misoli keltirilgan(x,y), biz birinchi navbatda tarmoqdagi barcha faollashtirishlarni, shu jumladan gipotezaning chiqish qiymatini hisoblash uchun "oldinga o'tish" ni ishga tushiramiz.hV,b(x). Keyin, har bir tugun uchuniqatlamdal, biz “xato atamasi”ni hisoblamoqchimizd(l)ibu tugun bizning chiqishimizdagi har qanday xatolar uchun qanchalik "javobgar"ligini o'lchaydi. Chiqish tugunlari uchun biz tarmoq faollashuvi va haqiqiy maqsad qiymati o'rtasidagi farqni to'g'ridan-to'g'ri o'lchashimiz va undan foydalanishimiz mumkin.d(nl)i(qaerda qatlamnlchiqish qatlami). Yashirin birliklar haqida nima deyish mumkin? Ular uchun biz hisoblaymizd(l)ifoydalanadigan tugunlarning xato shartlarining o'rtacha og'irligiga asoslangana(l)ikirish sifatida. Batafsil, bu erda orqaga tarqalish algoritmi:

  1. Qatlamlar uchun faollashtirishni hisoblab, oldinga uzatishni amalga oshiringL2,L3, va hokazo chiqish qatlamigachaLnl.

  2. Har bir chiqish birligi uchuniqatlamdanl(chiqish qatlami), o'rnating

d(nl)i=∂∂z(nl)i12‖yhV,b(x)‖2=−(yia(nl)i)⋅f'(z(nl)i)

  1. Uchunl=nl−1,nl−2,nl−3,…,2

Har bir tugun uchuniqatlamdal, oʻrnating
d(l)i=(∑sl+1j=1V(l)jid(l+1)j)f'(z(l)i)

  1. Istalgan qisman hosilalarni hisoblang, ular quyidagicha berilgan:

∂∂V(l)ijJ(V,b;x,y)=a(l)jd(l+1)i∂∂b(l)iJ(V,b;x,y)=d(l+1)i.
Nihoyat, matritsa-vektorli yozuvdan foydalanib, algoritmni qayta yozishimiz ham mumkin. foydalanamiz”∙” elementi mahsulot operatorini belgilash uchun ( .*Matlab yoki Oktavada belgilanadi va Hadamard mahsuloti deb ham ataladi), shuning uchun agara=bc, keyinai=bici. Ta'rifni qanday kengaytirganimizga o'xshashf(⋅)vektorlarga element bo'yicha qo'llash uchun biz ham xuddi shunday qilamizf'(⋅)(Shuning uchun; ... uchun; ... natijasidaf'([z1,z2,z3])=[f'(z1),f'(z2),f'(z3)]).
Keyin algoritm yozilishi mumkin:

  1. Qatlamlar uchun faollashtirishni hisoblab, oldinga uzatishni amalga oshiringL2,L3, chiqish qatlamigachaLnl, oldinga tarqalish bosqichlarini belgilovchi tenglamalardan foydalanish

  2. Chiqish qatlami uchun (qatlamnl), o'rnating

d(nl)=−(ya(nl))∙f'(z(nl))

  1. Uchunl=nl−1,nl−2,nl−3,…,2, oʻrnating

d(l)=((V(l))Td(l+1))∙f'(z(l))

  1. Kerakli qisman hosilalarni hisoblang:

V(l)J(V,b;x,y)=d(l+1)(a(l))T,∇b(l)J(V,b;x,y)=d(l+1).

Download 5,25 Mb.

Do'stlaringiz bilan baham:
1   ...   7   8   9   10   11   12   13   14   ...   31




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish