JavaScript для глубокого обучения 2021 TensorFlow js Ббк



Download 30,75 Mb.
Pdf ko'rish
bet385/457
Sana27.03.2022
Hajmi30,75 Mb.
#513488
1   ...   381   382   383   384   385   386   387   388   ...   457
Bog'liq
Цэй Ш., Байлесчи С., и др. - JаvaScript для глубокого обучения (Библиотека программиста) - 2021


Часть III • Продвинутые возможности глубокого обучения с TensorFlow.js
Упражнения
1. В примере тележки с шестом использовалась сеть стратегий, состоящая из 
скрытого слоя с 128 нейронами, в соответствии с настройками по умолчанию. 
Как влияет этот гиперпараметр на обучение, в основе которого лежит градиент­
ный спуск по стратегиям? Попробуйте поменять его на небольшое значение, 
например 4 или 8, и сравните полученную кривую обучения (кривую зависимо­
сти среднего количества ходов на игру от итерации) с аналогичной кривой при 
размере скрытого слоя по умолчанию. Какой вывод можно сделать из этого 
о связи между разрешающими возможностями модели и эффективностью оцен­
ки ею наилучшего действия?
2. Мы уже упоминали, что одно из преимуществ решения задач наподобие тележки 
с шестом с помощью машинного обучения — экономия затрат человеческого 
труда. А именно, при неожиданном изменении среды не нужно выяснять, 
как
именно она изменилась, и перерабатывать физические уравнения. Вместо этого 
достаточно повторного обучения агента. Убедитесь, что это так, по следующему 
алгоритму. Во­первых, запустите пример cart­pole из исходного кода, а не с веб­
страницы на сервере. Обучите соответствующую сеть стратегий с помощью обыч­
ного подхода. Во­вторых, поменяйте значение 
this.gravity
в файле 
cart-pole/
cart_pole.js
на новое (скажем, 12, чтобы притвориться, что мы перенесли нашу 
тележку с шестом на другую планету, с большей силой тяжести, чем на Земле!). 
Запустите страницу снова, загрузите обученную на первом шаге сеть стратегий 
и попробуйте ее в работе. Можно ли сказать, что она работает намного хуже, чем 
раньше, просто из­за повышенной силы тяжести? Наконец, обучите сеть стратегий 
на протяжении еще нескольких итераций. Начинает ли она снова играть лучше 
(приспосабливается к новой среде)?
3. (Упражнение, посвященное марковским 
процессам принятия решений и уравне­
нию Беллмана.) Представленный в под­
Download 30,75 Mb.

Do'stlaringiz bilan baham:
1   ...   381   382   383   384   385   386   387   388   ...   457




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish