Я. Гудфеллоу, И. Бенджио, А. Курвилль


y , но мы можем пред- положить, что  y



Download 14,23 Mb.
Pdf ko'rish
bet213/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   209   210   211   212   213   214   215   216   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

y
, но мы можем пред-
положить, что 
y
сгенерирована путем выбора одной из них, и сделать этот ненаблюдаемый 
выбор случайной величиной.


168 

 
Глубокие сети прямого распространения 
средних распределения с единственной модой. Мы хотим обновлять среднее 
только для компоненты, которая действительно породила наблюдение. На прак-
тике мы не знаем, какая компонента какое наблюдение породила. В выражении 
отрицательного логарифмического правдоподобия естественно взвешены вкла-
ды каждого примера в функцию потерь каждой компоненты, в роли веса высту-
пает вероятность того, что данная компонента породила данный пример.
3. Ковариации 
Σ
(
i
)
(
x
): определяют ковариационную матрицу каждой компоненты 
i
. Как и при обучении одной гауссовой компоненты, мы обычно берем диагональ-
ную матрицу, чтобы избежать вычисления определителей. Как и при обучении 
средних смеси, метод максимального правдоподобия осложняется необходи-
мостью приписать часть ответственности за каждую точку компонентам смеси. 
Алгоритм градиентного спуска автоматически будет следовать за правильным 
процессом, если ему предоставить корректную спецификацию отрицательного 
логарифмического правдоподобия для модели смеси.
Сообщалось, что градиентная оптимизация условных гауссовых смесей (на выходе 
нейронных сетей) может оказаться ненадежной, отчасти из-за операций деления (на 
дисперсию), которые могут быть численно неустойчивыми (если какая-то дисперсия 
получается слишком малой для конкретного примера, что приводит к очень большим 
градиентам). Одно из решений – 
обрезать градиенты
(см. раздел 10.11.1), другое – 
эвристически масштабировать градиенты (Murray and Larochelle, 2014).
Гауссовы смеси на выходе особенно эффективны в порождающих моделях речи 
(Schuster, 1999) и перемещения физических объектов (Graves, 2013). Стратегия сме-
совой плотности позволяет сети представить многомодальный выход и управлять 
дисперсией выхода, что очень важно для получения высококачественного результата 
в тех предметных областях, где на выходе получаются вещественные числа. Пример 
сети со смесовой плотностью показан на рис. 6.4.
x
y
Рис. 6.4 

Примеры получены от нейронной сети с выходным слоем 
в виде смеси распределений. Вход 
x
выбирается из равномерного распре-
деления, а выход y – из 
p
model
(
y

x
)
. Нейронная сеть способна обучить нели-
нейные отображения входа на параметры выходного распределения. В со-
став этих параметров входят вероятности, управляющие тем, какая из трех 
компонент смеси порождает выход, а также параметры отдельных компо-
нент. Каждая компонента смеси – нормальное распределение с предска-
занными средним и дисперсией. Все эти аспекты выходного распределе-
ния могут изменяться в зависимости от 
x
, причем нелинейно


Скрытые блоки 


Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   209   210   211   212   213   214   215   216   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish