Я. Гудфеллоу, И. Бенджио, А. Курвилль


Долгая краткосрочная память



Download 14,23 Mb.
Pdf ko'rish
bet431/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   427   428   429   430   431   432   433   434   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

10.10.1. Долгая краткосрочная память
Удачная мысль о введении петель для создания путей, по которым градиент может 
течь длительное время, – основной вклад в первоначальную модель долгой кратко-
срочной памяти (Hochreiter and Schmidhuber, 1997). Позднее было внесено важней-
шее дополнение – вес петли должен быть контекстно-обусловленным, а не фикси-
рованным (Gers et al., 2000). Сделав вес петли вентильным (управляемым другим 
скрытым блоком), мы можем динамически изменять временной масштаб интегри-
рования. В данном случае имеется в виду, что даже для LSTM с фиксированными 
параметрами временной масштаб интегрирования может изменяться в зависимости 
от входной последовательности, поскольку временные константы выводятся самой 
моделью. Идея LSTM оказалась чрезвычайно успешной во многих приложениях
например: неограниченное распознавание рукописных текстов (Graves et al., 2009), 
распознавание речи (Graves et al., 2013; Graves and Jaitly, 2014), порождение рукопис-
ных текстов (Graves, 2013), машинный перевод (Sutskever et al., 2014), подписывание 
изобра жений (Kiros et al., 2014b; Vinyals et al., 2014b; Xu et al., 2015) и грамматиче-
ский разбор (Vinyals et al., 2014a).
Принципиальная схема LSTM показана на рис. 10.16. Ниже приведены соответ-
ствующие уравнения прямого распространения для архитектуры мелкой рекуррент-
ной сети. Есть также примеры успешного использования более глубоких архитектур 
(Graves et al., 2013; Pascanu et al., 2014a). Вместо блока, который просто применяет 
поэлементную нелинейность к аффинному преобразованию входов и рекуррентным 
блокам, в рекуррентных LSTM-сетях имеются «LSTM-ячейки», обладающие внут-
ренней рекуррентностью (петлей) в дополнение к внешней рекуррентности РНС. 
У каждой ячейки такие же входы и выходы, как у обыкновенной рекуррентной сети, 
но еще имеются дополнительные параметры и система вентильных блоков, управ-
ляющих потоком информации. Самым важным компонентом является блок состоя-
ния 
s
i
(
t
)
с линейной петлей, аналогичный описанным выше блокам с утечкой. Однако 
теперь вес петли (или ассоциированная временна

я константа) управляется 

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   427   428   429   430   431   432   433   434   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish