Я. Гудфеллоу, И. Бенджио, А. Курвилль



Download 14,23 Mb.
Pdf ko'rish
bet320/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   316   317   318   319   320   321   322   323   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

8.3.2. Импульсный метод
Стохастический градиентный спуск остается популярной стратегией оптимизации, 
но обучение с его помощью иногда происходит слишком медленно. 
Импульсный ме-
тод
(Polyak, 1964) призван ускорить обучение, особенно в условиях высокой кри-
визны, небольших, но устойчивых градиентов или зашумленных градиентов. В им-
пульсном алгоритме вычисляется экспоненциально затухающее скользящее среднее 
прошлых градиентов и продолжается движение в этом направлении. Работа импульс-
ного метода иллюстрируется на рис. 8.5.
20
10
0
–10
–20
–30
–30 –20 –10
0
10
20
Рис. 8.5 

Импульсный метод призван решить две проблемы: плохую 
обусловленность матрицы Гессе и дисперсию стохастического градиента. 
На рисунке показано, как преодолевается первая проблема. Эллипсы обо-
значают изолинии квадратичной функции потерь с плохо обусловленной 
матрицей Гессе. Красная линия, пересекающая эллипсы, соответствует 
траектории, выбираемой в соответствии с правилом обучения методом мо-
ментов в процессе минимизации этой функции. Для каждого шага обуче-
ния стрелка показывает, какое направление выбрал бы в этот момент метод 
градиентного спуска. Как видим, плохо обусловленная квадратичная целе-
вая функция выглядит как длинная узкая долина или овраг с крутыми скло-
нами. Импульсный метод правильно перемещается вдоль оврага, тогда как 
градиентный спуск впустую тратил бы время на перемещение вперед-на-
зад поперек оврага. Сравните также с рис. 4.6, где показано поведение гра-
диентного спуска без учета импульса
Формально говоря, в импульсном алгоритме вводится переменная 
v
, играющая 
роль скорости, – это направление и скорость перемещения в пространстве парамет-
ров. Скорость устанавливается равной экспоненциально затухающему скользящему 
среднему градиента со знаком минус. Название алгоритма проистекает из физиче-
ской аналогии, согласно которой отрицательный градиент – это сила, под действием 
которой частица перемещается в пространстве параметров согласно законам Нью-
тона. В физике импульсом называется произведение массы на скорость. В импульс-



Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   316   317   318   319   320   321   322   323   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish