Я. Гудфеллоу, И. Бенджио, А. Курвилль


обратным распространением во времени



Download 14,23 Mb.
Pdf ko'rish
bet400/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   396   397   398   399   400   401   402   403   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

обратным распространением во времени
(back-propagation 
through time – BPTT) и будет подробно рассмотрен в разделе 10.2.2. Таким образом, 
сеть с рекурсией между скрытыми блоками является очень мощной, но дорогой для 
обучения. Существует ли альтернатива?
10.2.1. Форсирование учителя и сети с рекурсией на выходе
Сеть, в которой имеются только рекуррентные связи между выходными блоками 
на одном временном шаге и скрытыми блоками на следующем (рис. 10.4), является 
строго менее мощной, потому что ей недостает рекуррентных связей между скрыты-
ми блоками. Так, с ее помощью нельзя смоделировать универсальную машину Тью-
ринга. Поскольку в сети нет рекуррентных связей между скрытыми блоками, необхо-
димо, чтобы выходные блоки запоминали всю ту информацию о прошлом, которую 
сеть будет использовать для предсказания будущего. Поскольку выходные блоки 
Рис. 10.5 

Развернутая во времени рекуррентная нейронная сеть 
с единственным выходом в конце последовательности. Такую сеть можно 
использовать для агрегирования последовательности и порождения пред-
ставления фиксированного размера, подаваемого на вход следующего 
этапа обработки. В самом конце может быть сравнение с меткой (как по-
казано на рисунке), но можно также получить градиент 
o
(
t
)
посредством об-
ратного распространения от последующих модулей


324 

 
Моделирование последовательностей: рекуррентные и рекурсивные сети
явно обуча ются совпадению с метками обучающего набора, то маловероятно, что они 
запомнят нужную информацию о прошлой истории входов, – разве что пользова-
тель знает, как описать полное состояние системы, и включает эти сведения в состав 
выходных меток обучающего набора. Но у исключения рекуррентных связей между 
скрытыми блоками есть и преимущество – для любой функции потерь, основанной 
на сравнении предсказания в момент 
t
с меткой в момент 
t
, все временные шаги пол-
ностью независимы. Следовательно, обучение можно распараллелить и вычислять 
градиент для каждого шага 
t
изолированно. Нет нужды вычислять сначала выход для 
предыдущего временного шага, потому что обучающий набор уже содержит идеаль-
ное значение этого выхода.
Модели, в которых имеются рекуррентные связи, идущие от выходов обратно в мо-
дель, можно обучить методом 

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   396   397   398   399   400   401   402   403   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish