JavaScript для глубокого обучения 2021 TensorFlow js Ббк



Download 30,75 Mb.
Pdf ko'rish
bet292/457
Sana27.03.2022
Hajmi30,75 Mb.
#513488
1   ...   288   289   290   291   292   293   294   295   ...   457
Bog'liq
Цэй Ш., Байлесчи С., и др. - JаvaScript для глубокого обучения (Библиотека программиста) - 2021


Глава 9. Глубокое обучение для последовательностей и текста
349
Текстовая сводка топологии модели simpleRNN, созданной в листинге 9.2, вы­
глядит следующим образом:
Layer (type) Output shape Param #
=================================================================
simple_rnn_SimpleRNN1 (Simpl [null,32] 1504
_________________________________________________________________
dense_Dense1 (Dense) [null,1] 33
=================================================================
Total params: 1537
Trainable params: 1537
Non-trainable params: 0
_________________________________________________________________
В ней намного меньше весовых параметров, чем в ранее описанном MLP 
(1537 вместо 107 585, то есть в 70 раз меньше), но потери MAE на проверочном на­
боре данных ниже (то есть предсказания более точны), чем у MLP во время обуче­
ния (0,271 вместо 0,289). Это небольшое, но стабильное сокращение погрешности 
предсказания температуры подчеркивает мощь единства параметров на основе 
временно
'
й инвариантности и преимущества RNN при обучении на последователь­
ных данных, такие как наши метеорологические измерения.
Наверное, вы обратили внимание на то, что, несмотря на относительно небольшое 
число весовых параметров в слое simpleRNN, его обучение и выполнение вывода про­
исходят намного дольше, чем в моделях прямого распространения, подобных MLP. 
Этот основной недостаток RNN — следствие невозможности распараллеливания 
операций над отдельными временн
ы
ми шагами. А невозможно распараллеливание 
потому, что последующие шаги зависят от значений состояния, вычисляемых на 
предыдущих шагах (см. рис. 9.2 и псевдокод в листинге 9.1). В нотации «O большое»: 
прямой проход RNN занимает 
O
(
n
) времени, где 
n
— число входных временн
ы
х ша­
гов. Обратный проход (BPTT) занимает еще 
O
(
n
) времени. Входной признак задачи 
Jena­weather состоит из большого количества (240) временн
ы
х шагов, в результате 
чего обучение и длится так долго, как мы видели ранее. Именно поэтому мы обучаем 
модель в tfjs­node, а не в браузере.
Ситуация с RNN разительно отличается от ситуации со слоями прямого рас­
пространения, например плотными и conv2d. В этих слоях можно распараллелить 
вычисления по входным элементам, поскольку операция над одним элементом 
не зависит от результатов, которые дают другие входные элементы. Благодаря этому 
прямой и обратный проходы для подобных слоев прямого распространения зани­
мают менее 
O
(
n
) времени (в некоторых случаях около 
O
(1)) при использовании 
GPU для ускорения вычислений. В разделе 9.2 мы изучим еще несколько распа­
раллеливаемых подходов к моделированию последовательных данных, в частности 
одномерную свертку. Впрочем, познакомиться с RNN все равно не помешает, ведь 
одномерная свертка не обладает в определенном смысле такой чувствительностью 
к позиции элементов последовательности, как они (больше об этом рассказывается 
далее).


350
Download 30,75 Mb.

Do'stlaringiz bilan baham:
1   ...   288   289   290   291   292   293   294   295   ...   457




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish