Я. Гудфеллоу, И. Бенджио, А. Курвилль


гих общих подвыражений. Такую стратегию заполнения таблицы иногда называют  динамическим программированием



Download 14,23 Mb.
Pdf ko'rish
bet239/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   235   236   237   238   239   240   241   242   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

191
гих общих подвыражений. Такую стратегию заполнения таблицы иногда называют 
динамическим программированием
.
6.5.7. Пример: применение обратного распространения 
к обучению МСП
В качестве примера подробно проанализируем применение алгоритма обратного рас-
пространения к обучению многослойного перцептрона.
Мы разработаем очень простой многослойный перцептрон всего с одним скрытым 
слоем. Для обучения этой модели будем использовать метод стохастического гради-
ентного спуска с мини-пакетом. Алгоритм обратного распространения вычисляет 
градиент функции стоимости на одном мини-пакете. Точнее, мы используем мини-
пакет примеров из обучающего набора, представленного в виде матрицы плана 
X
и вектора ассоциированных меток класса 
y
. Сеть вычисляет слой скрытых признаков 
H
= max{0, 
XW
(1)
}. Для простоты в этой модели отсутствуют смещения. Мы предпо-
лагаем, что язык графов включает операцию 
relu
, которая поэлементно вычисляет 
max{0, 
Z
}. Затем выдаются предсказания в виде ненормированных логарифмов веро-
ятностей классов 
HW
(2)
. Мы предполагаем также, что язык графов включает опера-
цию 
cross_entropy
, вычисляющую перекрестную энтропию между метками 
y
и рас-
пределением вероятности, определяемым этими ненормированными логарифмами 
вероятностей. Результат вычисления перекрестной энтропии определяет стоимость 
J
MLE
. Минимизация перекрестной энтропии дает оценку максимального правдоподо-
бия классификатора. Но, чтобы сделать пример более реалистичным, мы включили 
еще член регуляризации. Общая стоимость равна
(6.56)
и состоит из перекрестной энтропии и члена снижения весов с коэффициентом 
λ

Граф вычислений показан на рис. 6.11.
Граф вычислений градиента в этом примере настолько велик, что и рисовать, и чи-
тать его утомительно. Это наглядная демонстрация одного из преимуществ алгорит-
ма обратного распространения: он автоматически генерирует градиенты, ручной вы-
вод которых хотя и не представляет принципиальных трудностей, но требует много 
времени.
Мы можем составить приблизительное представление о поведении алгоритма об-
ратного распространения, взглянув на граф прямого распространения на рис. 6.11. 
Для обучения нам нужно вычислить 


Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   235   236   237   238   239   240   241   242   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish