JavaScript для глубокого обучения 2021 TensorFlow js Ббк



Download 30,75 Mb.
Pdf ko'rish
bet359/457
Sana27.03.2022
Hajmi30,75 Mb.
#513488
1   ...   355   356   357   358   359   360   361   362   ...   457
Bog'liq
Цэй Ш., Байлесчи С., и др. - JаvaScript для глубокого обучения (Библиотека программиста) - 2021


Часть III • Продвинутые возможности глубокого обучения с TensorFlow.js
Основные отличия этой системы от вышеприведенного классификатора.
z
z
За время игрового эпизода модель вызывается несколько раз (на каждом вре­
менном шаге).
z
z
Выходной сигнал модели (выходной сигнал из прямоугольника «Сеть стратегий» 
на рис. 11.4) представляет собой логиты, а не оценки вероятности. Далее логиты 
преобразуются в оценки вероятности с помощью сигма­функции. Но мы не вклю­
чаем нелинейность в виде сигма­функции в последний (выходной) слой сети стра­
тегий, поскольку для обучения нам понадобятся логиты, как вы скоро увидите.
z
z
Вероятности на выходе сигма­функции необходимо преобразовать в конкретное 
действие (приложение силы вправо/влево). Для этого служит вызов функции 
tf.multinomial()
, производящей случайную выборку. Как вы помните, мы ис­
пользовали функцию 
tf.multinomial()
в главе 10, при выборке следующего сим­
вола на основе вероятностей символов алфавита из многомерной логистической 
функции. Сейчас все немного проще, поскольку необходимо выбрать один из 
всего двух вариантов.
Рис. 11.4.
Решение задачи удержания равновесия шеста на тележке с помощью сети стратегий. 
Данная сеть стратегий представляет собой модель TensorFlow.js, выдающую на выходе вероятность 
действия «приложение силы влево» при векторе наблюдений (x, x', 
θ
и 
θ
') в качестве входного 
сигнала. Вероятность преобразуется в нужное действие путем случайной выборки
Последний из этих пунктов влечет за собой более серьезные последствия. Мы ведь 
могли
бы преобразовать выходной сигнал функции 
tf.sigmoid()
непосредственно 
в действие с помощью порогового значения (например, выбирать действие при­
ложения силы влево, когда выходной сигнал сети больше 0,5 и вправо в противном 
случае). Почему же мы предпочли этому простому подходу более сложный вариант 
со случайной выборкой с помощью функции 
tf.multinomial()
? Дело в том, что нам 
нужна
стохастичность функции 
tf.multinomial()
. В самом начале обучения сеть 
стратегий не имеет понятия, как выбрать направление приложения силы, посколь­
ку начальные значения весов задаются случайным образом. Благодаря случайной 
выборке сеть поощряется выполнять случайные действия и находить среди них 
те, что обеспечивают наилучшие результаты. Одна часть этих случайных проб де­
монстрирует не слишком хорошие результаты, а другая — хорошие. Наш алгоритм 


Download 30,75 Mb.

Do'stlaringiz bilan baham:
1   ...   355   356   357   358   359   360   361   362   ...   457




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish