JavaScript для глубокого обучения 2021 TensorFlow js Ббк



Download 30,75 Mb.
Pdf ko'rish
bet350/457
Sana27.03.2022
Hajmi30,75 Mb.
#513488
1   ...   346   347   348   349   350   351   352   353   ...   457
Bog'liq
Цэй Ш., Байлесчи С., и др. - JаvaScript для глубокого обучения (Библиотека программиста) - 2021


Часть III • Продвинутые возможности глубокого обучения с TensorFlow.js
задачи и генерации текста произвольной длины можно использовать LSTM. Сто­
хастичностью (степенью случайности и непредсказуемости) сгенерированного 
текста можно управлять с помощью параметра температуры.
z
z
Автокодировщик — тип генеративной модели, состоящий из кодировщика 
и декодировщика. Сначала кодировщик уплотняет входные данные в сжатое 
представление — латентный вектор (z­вектор). Затем декодировщик пытается 
восстановить исходные данные по одному латентному вектору. В процессе об­
учения кодировщик становится высокоэффективным средством сжатия данных, 
а декодировщик наделяется знанием статистического распределения примеров 
данных. VAE накладывает дополнительные статистические ограничения на 
латентные векторы так, что содержащие эти векторы латентные пространства 
после обучения VAE демонстрируют непрерывно меняющиеся и удобные для 
интерпретации структуры.
z
z
В основе GAN лежит идея «единства и борьбы» дискриминатора и генератора. 
Дискриминатор пытается отличить настоящие примеры данных от сгенерирован­
ных, а генератор стремится сгенерировать поддельные примеры, способные «об­
мануть» дискриминатор. В ходе их совместного обучения генератор постепенно 
становится способен генерировать правдоподобные примеры данных. ACGAN 
добавляет в базовую архитектуру GAN информацию о классах, позволяя задавать 
желаемый класс примеров данных для генерации.


В этой главе
z

Отличия обучения с подкреплением от обсуждавшегося в предыдущих главах об-
учения с учителем.
z

Основная парадигма обучения с подкреплением: агент, среда, действие и возна-
граждение, а также их взаимодействия.
z

Основные идеи двух главных подходов к решению задач обучения с подкреплени-
ем: на основе стратегий и на основе ценности.
До сих пор в книге мы сосредотачивали свое внимание в основном на так называ­
емом 
обучении с учителем
(supervised learning). При таком обучении модель обуча­
ется правильно реагировать на входной сигнал. Присваивает ли она метку класса 
входному изображению (см. главу 4) или предсказывает температуру в будущем по 
прошлым метеорологическим данным (см. главы 8 и 9), парадигма остается неизмен­
ной: статическим входным данным ставятся в соответствие статические выходные 
данные. Модели генерации последовательностей, обсуждавшиеся в главах 9 и 10, 
были чуть сложнее, поскольку выходной сигнал в них представлял собой последо­
вательность элементов, а не отдельный элемент. Но соответствующие задачи все 
равно можно свести к варианту «один элемент на входе — один элемент на выходе», 
разбив последовательности на шаги.
В этой главе мы рассмотрим совершенно иную разновидность машинного об­
учения — 
обучение с подкреплением
(reinforcement learning, RL). В нем главное 
11
Основы глубокого обучения 
с подкреплением


428
Download 30,75 Mb.

Do'stlaringiz bilan baham:
1   ...   346   347   348   349   350   351   352   353   ...   457




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish