Я. Гудфеллоу, И. Бенджио, А. Курвилль


10.7. Проблема долгосрочных зависимостей



Download 14,23 Mb.
Pdf ko'rish
bet422/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   418   419   420   421   422   423   424   425   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

339
10.7. Проблема долгосрочных зависимостей
Математическая проблема обучения долгосрочных зависимостей в рекуррентных 
сетях описана в разделе 8.2.5. Основная трудность состоит в том, что градиенты, рас-
пространяющиеся через много слоев, либо исчезают (в большинстве случаев), либо 
начинают взрывообразно расти (редко, но с большим уроном для оптимизации). 
Даже если предположить, что при заданных параметрах рекуррентная сеть устойчива 
(может хранить воспоминания без взрывного роста градиентов), все равно остается 
проблема назначения долгосрочным зависимостям экспоненциально меньших (из-за 
перемножения большого числа якобианов) весов, чем краткосрочным. Во многих ис-
точниках этот вопрос освещается более глубоко (Hochreiter, 1991; Doya, 1993; Bengio 
et al., 1994; Pascanu et al., 2013). В этом разделе мы подробнее опишем саму проблему, 
а в последующих – подходы к ее преодолению.
В рекуррентных сетях композиция одной и той же функции вычисляется много-
кратно – по одному разу на каждом временном шаге. Это может приводить к поведе-
нию, весьма далекому от линейного (рис. 10.15).
Координата входа
Проекция выхода
4
3
2
1
0
–1
–2
–3
–4
–60
–40
–20
0
20
40
60
1
2
3
4
5
6
Рис. 10.15 

Повторная композиция функций. Многократная композиция 
нелинейной функции (например, показанного здесь гиперболического тан-
генса) приводит к сильно нелинейному результату; обычно в большинстве 
точек производная очень мала, в некоторых велика, и часто наблюдается 
переход от возрастания к убыванию и наоборот. На этом рисунке показана 
линейная проекция 100-мерного скрытого состояния на одно измерение, 
отложенное по оси 
y
. По оси 
x
отложена координата начального состоя-
ния вдоль случайно выбранного направления в 100-мерном пространстве. 
Таким образом, этот график можно рассматривать как сечение графика 
многомерной функции. На графиках показана функция после каждого вре-
менного шага, или, эквивалентно, результат многократной композиции 
функции перехода с самой собой
В частности, композиция функция, применяемая в рекуррентных нейронных се-
тях, чем-то напоминает умножение матриц. Рекуррентное соотношение

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   418   419   420   421   422   423   424   425   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish