Я. Гудфеллоу, И. Бенджио, А. Курвилль


учитывается также гессиан, как в методе Ньютона, то это  алгоритм оптимизации



Download 14,23 Mb.
Pdf ko'rish
bet102/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   98   99   100   101   102   103   104   105   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

91
учитывается также гессиан, как в методе Ньютона, то это 
алгоритм оптимизации 
второго порядка
(Nocedal and Wright, 2006).
20
10
0
–10
–20
–30
–30 –20 –10
0
х
1
х
2
10
20
Рис. 4.6 

Метод градиентного спуска не использует информацию о кри-
визне, содержащуюся в гессиане. Здесь градиентный спуск применяется 
для минимизации квадратичной функции 
f
(
x
)
, для которой число обуслов-
ленности гессиана равно 5. Это означает, что величина кривизны в направ-
лениях наибольшей и наименьшей кривизны различается в пять раз. В дан-
ном случае направление наибольшей кривизны совпадает с вектором [1, 1]


а наименьшей – с вектором [1, –1]

. Красной линией показан путь, которым 
следует метод градиентного спуска. Эта вытянутая квадратичная функция 
напоминает длинный каньон. Градиентный спуск бесполезно тратит много 
времени, раз за разом спускаясь по стенкам каньона, поскольку это направ-
ления наискорейшего спуска. Так как шаг слишком большой, мы проскакива-
ем мимо дна каньона и вынуждены спускаться по противоположной стенке 
на следующей итерации. Большое положительное значение матрицы Гессе, 
соответствующее собственному вектору в этом направлении, подсказывает, 
что производная по этому направлению быстро возрастает, поэтому алго-
ритм оптимизации мог бы воспользоваться гессианом и понять, что в данном 
случае производить поиск в направлении наискорейшего спуска не стоит
Алгоритмы оптимизации, применяемые в большинстве случаев, рассматриваемых 
в этой книге, годятся для широкого спектра функций, но не дают почти никаких га-
рантий. Отсутствие гарантий связано с тем, что функции, используемые в глубоком 
обучении, чрезвычайно сложны. Во многих других областях принято разрабатывать 
алгоритмы оптимизации для ограниченного семейства функций.
В контексте глубокого обучения иногда можно получить некоторые гарантии, 
если ограничиться функциями, которые либо удовлетворяют 
условию Липшица

либо имеют производные, удовлетворяющие этому условию. Говорят, что функция 
f
удовлетворяет условию Липшица, если скорость ее изменения ограничена некоторой 
константой 

, которая называется постоянной Липшица:


Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   98   99   100   101   102   103   104   105   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish