Я. Гудфеллоу, И. Бенджио, А. Курвилль



Download 14,23 Mb.
Pdf ko'rish
bet305/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   301   302   303   304   305   306   307   308   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

8.2.1. Плохая обусловленность
Ряд проблем возникает даже при оптимизации выпуклых функций. Самая известная 
из них – плохая обусловленность матрицы Гессе 
H
. Это очень общая проблема, при-
сущая большинству методов численной оптимизации, все равно, выпуклой или нет, 
она подробно описана в разделе 4.3.1.


244 

 
Оптимизация в обучении глубоких моделей
Считается, что проблема плохой обусловленности присутствует во всех задачах 
обучения нейронных сетей. Она может проявляться в «застревании» СГС в том смыс-
ле, что даже очень малые шаги увеличивают функцию стоимости.
Напомним, что согласно формуле (4.9) разложение функции стоимости в ряд Тей-
лора до членов второго порядка показывает, что шаг градиентного спуска величиной 

ε
g
увеличивает стоимость на
1
/

ε
2
g

Hg
– 
ε
g

g

(8.10)
Плохая обусловленность градиента становится проблемой, когда 
1
/

ε
2
g

Hg
больше 
ε
g

g
. Чтобы понять, страдает ли задача обучения нейронной сети от плохой обуслов-
ленности, можно понаблюдать за квадратом нормы градиента 
g

g
и членом 
g

Hg
. Во 
многих случаях норма градиента не сильно уменьшается за время обучения, тогда 
как член 
g

Hg
возрастает больше, чем на порядок. В результате обучение происходит 
очень медленно, несмотря на большой градиент, т. к. приходится уменьшать скорость 
обучения, чтобы компенсировать еще большую кривизну. На рис. 8.1 приведен при-
мер, когда градиент значительно увеличивается в ходе успешного обучения нейрон-
ной сети.
Время обучения (периоды)
Время обучения (периоды)
16
14
12
10
8
6
4
2
0
–2
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
Норма градиента
Частота ошибок 
классификации
–50 0
50 100 150 200 250
0
50 100 150 200 250

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   301   302   303   304   305   306   307   308   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish