Я. Гудфеллоу, И. Бенджио, А. Курвилль


μ , опреде- ляет распределение вероятности  p ( y |  x



Download 14,23 Mb.
Pdf ko'rish
bet283/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   279   280   281   282   283   284   285   286   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

μ
, опреде-
ляет распределение вероятности 
p
(
y

x

μ
). Среднее арифметическое по всем маскам 
равно
(7.53)
где 
p
(
μ
) – распределение вероятности, которое использовалось для выборки 
μ
на эта-
пе обучения.
Поскольку количество членов в этой сумме экспоненциально велико, вычислить 
ее можно только в случае, когда структура модели допускает какое-то упрощение. 
Пока что неизвестны нейронные сети, допускающие такое упрощение. Но мы можем 
аппроксимировать вывод с помощью выборки, усреднив выходы для нескольких ма-
сок. Даже 10–20 масок часто достаточно для получения хорошего качества.
Но есть подход еще лучше – он позволяет получить хорошую аппроксимацию 
предсказаний всего ансамбля, произведя всего одно прямое распространение. Для 
этого мы вместо среднего арифметического распределений, предсказанных члена-
ми ансамбля, будем вычислять среднее геометрическое. В работе Warde-Farley et 
al. (2014) приведены аргументы и эмпирические свидетельства в пользу того, что 
в этом контексте среднее геометрическое дает качество, сравнимое со средним ариф-
метическим.
Вообще говоря, не гарантируется, что среднее геометрическое нескольких распре-
делений вероятности само является распределением вероятности. Чтобы получить 
такую гарантию, мы потребуем, чтобы ни одна подмодель не назначала никаким со-
бытиям вероятность 0, а затем произведем нормировку получившегося распределе-
ния. Ненормированное распределение вероятности, определяемое средним геомет-
рическим, имеет вид:
(7.54)
где 
d
– число блоков, которые можно выбросить. Здесь для простоты взято равно-
мерное распределение 
μ
, но неравномерные распределения тоже допустимы. Чтобы 
можно было делать предсказания, необходимо перенормировать ансамбль:
(7.55)
Основная идея (Hinton et al., 2012c) прореживания состоит в том, что 
p
ensemble
можно 
аппроксимировать, вычислив 
p
(
y

x
) для одной модели: она включает все блоки, но 
веса связей, исходящих из 
i
-го блока, умножаются на вероятность включения этого 
блока. Обоснование такой модификации – стремление получить правильное ожидае-
мое значение выхода блока. Этот подход мы называем 

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   279   280   281   282   283   284   285   286   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish