Я. Гудфеллоу, И. Бенджио, А. Курвилль



Download 14,23 Mb.
Pdf ko'rish
bet341/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   337   338   339   340   341   342   343   344   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

g


w
y

. Посмотрим, 
что произой дет, когда мы произведем обновление 
w

w
– 
ε
g
. Разложение 
y

 
в ряд Тей-
лора до членов первого порядка предсказывает, что значение 
y

уменьшится на 
ε
g

g

Если бы мы хотели уменьшить 
y

на 0.1, то, исходя из этой информации первого по-
рядка, содержащейся в градиенте, могли бы установить скорость обучения 
ε
равной
0.1/(
g

g
). Однако фактическое обновление будет включать также эффекты второго, 
третьего, …, 
l
-го порядка. Новое значение 
y

равно:
x
(
w
1
– 
ε
g
1
)(
w
2
– 
ε
g
2
)…(
w
l
– 
ε
g
l
). 
(8.34)
Пример члена второго порядка, возникающего при таком обновлении, – 
ε
2
g
1
g
2

l
i
=3
w
i

Этот член может быть пренебрежимо мал, если произведение 

l
i
=3
w
i
мало, а может 
быть экспоненциально велик, если веса в слоях с 3 по 
l
больше 1. Поэтому очень трудно 
выбрать правильную скорость обучения, т. к. эффект обновления параметров одного 
слоя сильно зависит от всех остальных слоев. Алгоритмы оптимизации второго по-


Стратегии оптимизации и метаалгоритмы 

273
рядка решают эту проблему, учитывая при вычислении обновления взаимодействия 
второго порядка, но, как мы видим, в очень глубоких сетях даже взаимодействия бо-
лее высокого порядка могут быть существенными. Но уж если оптимизация второ-
го порядка обходится дорого и обычно требует многочисленных аппроксимаций, не 
позволяющих точно учесть значимых взаимодействий второго порядка, то попытка 
построения алгоритма оптимизации 
n
-го порядка при 
n
> 2 выглядит совершенно 
безнадежной. Что же предпринять вместо этого?
Пакетная нормировка предлагает элегантный способ перепараметризации почти 
любой глубокой сети. Перепараметризация значительно снижает остроту проблемы 
координации обновлений между многими слоями. Пакетную нормировку можно 
применить к входному и любому скрытому слою сети. Пусть 
H
– мини-пакет актива-
ций нормируемого слоя, представленный в виде матрицы плана, так что активации 
для каждого примера занимают одну строку матрицы. Для нормировки заменим 

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   337   338   339   340   341   342   343   344   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish