Я. Гудфеллоу, И. Бенджио, А. Курвилль


x t , активации скрытого слоя –  h



Download 14,23 Mb.
Pdf ko'rish
bet399/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   395   396   397   398   399   400   401   402   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

x
t
, активации скрытого слоя – 
h
(
t
)
, выходы – 
o
(
t
)
, мет-
ки – 
y
(
t
)
, а потеря – 
L
(
t
)
. (Слева) Принципиальная схема. (Справа) Развер-
нутый граф вычислений. Такая РНС менее мощная (способна выразить 
меньшее множество функций), чем РНС из семейства на рис. 10.3. РНС, 
показанная на рис. 10.3, может поместить любую информацию о прошлом 
в скрытое представление 
h
и передать 
h
в будущее. РНС на этом рисунке 
обучена помещать конкретное выходное значение в 
o
, и 
o
– единственная 
информация, которую разрешено передавать в будущее. Не существует 
прямых горизонтальных связей, исходящих из 
h
. Предыдущий 
h
связан 
с настоящим только косвенно – с помощью порожденных им предсказаний. 
Если размерность вектора 
o
не слишком велика, то в нем обычно отсут-
ствует какая-то важная информация о прошлом. Поэтому такая РНС менее 
мощная, но зато ее легче обучить, потому что каждый временной шаг можно 
обучать отдельно от всех остальных, благодаря чему возможно в большей 
степени распараллелить обучение (см. раздел 10.2.1)


Рекуррентные нейронные сети 

323
где 
p
model
(
y
(
t
)
| {
x
(1)
, …, 
x
(
t
)
}) берется из элемента 
y
(
t
)
выходного вектора модели 
y
ˆ
(
t
)
. Вы-
числение градиента этой функции потерь относительно параметров – дорогая опе-
рация. Для вычисления градиента необходимо выполнить прямое распространение, 
двигаясь слева направо по развернутому графу на рис. 10.3, а затем обратное распро-
странение, двигаясь справа налево по тому же графу. Время работы имеет порядок 
O
(
τ
), и его нельзя уменьшить за счет распараллеливания, потому что граф прямого 
распространения принципиально последовательный: каждый временной шаг можно 
обсчитать только после завершения предыдущего. Состояния, вычисленные во вре-
мя прямого прохода, необходимо хранить до повторного использования на обратном 
проходе, поэтому объем потребляемой памяти также имеет порядок 
O
(
τ
). Алгоритм 
обратного распространения, применяемый к развернутому графу и имеющий слож-
ность 
O
(
τ
), называется 

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   395   396   397   398   399   400   401   402   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish