Я. Гудфеллоу, И. Бенджио, А. Курвилль


Совместное обучение глубоких машин Больцмана



Download 14,23 Mb.
Pdf ko'rish
bet703/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   699   700   701   702   703   704   705   706   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

20.4.5. Совместное обучение глубоких машин Больцмана
Для классической ГМБ требуется жадное предобучение без учителя, а чтобы она хо-
рошо выполняла классификацию, необходим отдельный основанный на МСП клас-
сификатор поверх выделенных ей скрытых признаков. У этой схемы есть нежела-
тельные свойства. Трудно следить за качеством в процессе обучения, поскольку мы 
не можем вычислить свойства полной ГМБ во время обучения первой ОМБ. Поэтому 
сказать, насколько хорошо выбраны гиперпараметры, можно только, когда процесс 
обучения зайдет достаточно далеко. Программным реализациям ГМБ нужно много 
различных компонент: для обучения отдельных ОМБ методом CD, обучения полной 
ГМБ методом PCD и обучения на основе обратного распространения через МСП. 
Наконец, МСП, построенные поверх машины Больцмана, теряют многие преимуще-
ства ее вероятностной модели, например способность выполнять вывод, когда часть 
входных значений отсутствует.
Существуют два основных способа решить проблему совместного обучения глу-
бокой машины Больцмана. Первый – 
центрированная глубокая машина Больцмана
(Montavon and Muller, 2012), когда модель перепараметризуется так, чтобы гессиан 
функции стоимости был лучше обусловлен в начале процесса обучения. В резуль-
тате получается модель, которую можно обучить без этапа жадного послойного 
предобучения. Эта модель достигает отличного логарифмического правдоподобия 
на тестовом наборе и порождает примеры высокого качества. К сожалению, она по-
прежнему не может конкурировать с правильно регуляризированным МСП в роли 
классификатора. Второй способ – использовать 
многопредсказательную глубокую 
машину Больцмана
(multi-prediction deep Boltzmann machine) (Goodfellow et al., 
2013b). В этой модели применяется альтернативный критерий обучения, который по-
зволяет использовать алгоритм обратного распространения, чтобы избежать проблем 
с MCMC-оценками градиента. К сожалению, новый критерий не приводит к хороше-



Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   699   700   701   702   703   704   705   706   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish