Neyron tarmoq asoslari va uni chuqur o'rganish


 функции активации; 



Download 3,8 Mb.
bet58/112
Sana11.06.2022
Hajmi3,8 Mb.
#655828
TuriГлава
1   ...   54   55   56   57   58   59   60   61   ...   112
Bog'liq
2 bo\'lim (2)

 функции активации;


 функции потерь;




  1. Источник: IEEE Spectrum // http://spectrum.ieee.org/computing/software/the-neural-network-that-remembers.

Общие архитектурные принципы глубоких сетей 93
 методы оптимизации;
 гиперпараметры.

Затем дополним их новыми строительными блоками:  ограниченные машины Больцмана (ОМБ);  автокодировщики.


Далее на основе этих идей мы рассмотрим следующие архитектуры глубоких сетей:




 сети, предобученные без учителя;  сверточные нейронные сети (СНС);  рекуррентные нейронные сети (РНС);  рекурсивные нейронные сети.
По ходу этой главы мы будем сообщать о том, как в DL4J реализованы некото-рые аспекты глубоких сетей. А пока начнем с вопроса об обобщении параметров на глубокие сети.


Параметры



    1. главе 1 мы узнали, что в машинном обучении параметры – это вектор x в урав-нении Ax = b. Параметры нейронной сети имеют непосредственное отношение к весам связей в сети. На рис. 1.4 показано, что вектор параметров x представлен вектором-столбцом. Для получения вектора-столбца результатов b мы умножаем матрицу A на вектор параметров x. Чем ближе вектор b к фактическим меткам, присутствующим в обучающих данных, тем лучше наша модель. Для нахождения хороших значений вектора параметров, доставляющих минимум функции по-терь на обучающем наборе, применяются методы оптимизации, например гра-диентный спуск.




      1. глубоких сетях также имеется вектор параметров, представляющий связи




  1. оптимизируемой модели. Но важнейшее отличие глубоких сетей в части пара-метров состоит в том, как соединены между собой слои в различных архитектурах.




    1. ГСД мы видим два параллельных набора прямых связей между двумя раздель-ными сетями. Слои одной сети состоят из ГМБ (вполне самостоятельных подсетей, которые мы рассмотрим ниже в этой главе), которые служат для выделения при-знаков в интересах другой сети. Другой сетью в ГСД является многослойная ней-ронная сеть прямого распространения, в которой признаки, выделенные из слоев ГМБ, используются для инициализации весов. Это лишь один из многих примеров того, как параметры (веса) специализируются в разных архитектурах.




Download 3,8 Mb.

Do'stlaringiz bilan baham:
1   ...   54   55   56   57   58   59   60   61   ...   112




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish