Я. Гудфеллоу, И. Бенджио, А. Курвилль



Download 14,23 Mb.
Pdf ko'rish
bet647/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   643   644   645   646   647   648   649   650   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

распределение шумов
p
noise
(
x
). Оно должно быть 
легко вычислимо и выборка из него не должна вызывать затруднений. Теперь мы мо-
жем построить модель, включающую 
x
и новую бинарную переменную класса 
y
. Для 
новой совместной модели мы постулируем:
p
joint
(
y
= 1) = 
1
/
2

(18.29)
p
joint
(
x

y
= 1) = 
p
model
(
x
), 
(18.30)
и
p
joint
(
x

y
= 0) = 
p
noise
(
x
). 
(18.31)
Иными словами, переменная 
y
– переключатель, определяющий, из какого распре-
деления выбирать 
x
: из модели или из шума.
Можно построить аналогичную совместную модель обучающих данных. В этом 
случае переключатель определяет, выбирается 
x
из распределения 
данных
или из 
шума. Формально 
p
train
(
y
= 1) = 
1
/
2

p
train
(
x

y
= 1) = 
p
data
(
x
), 
p
train
(
x

y
= 0) = 
p
noise
(
x
).
Теперь можно применить стандартное обучение методом максимального правдо-
подобия к задаче обучения с учителем, заключающейся в подгонке 
p
joint
к 
p
train
.
(18.32)
Распределение 
p
joint
– это, по существу, модель логистической регрессии, приме-
ненная к разности логарифмов распределения вероятности модели и шума.
(18.33)
(18.34)
(18.35)
(18.36)

σ
(log 
p
model
(
x
) – log 
p
noise
(
x
)). 
(18.37)


Шумосопоставительное оценивание 

523
Таким образом, метод NCE применить просто при условии, что log 
p
~
model
легко под-
дается обратному распространению, и, как было сказано выше, 
p
noise
легко вычисляет-
ся (для вычисления 
p
joint
) и допускает простую выборку (для генерации обучающих 
данных).
Особенный успех методу NCE сопутствует в задачах с небольшим числом случай-
ных величин, но он неплохо работает и тогда, когда эти величины принимают много 
разных значений. Например, он успешно применялся к моделированию условного 
распределения слова при известном контексте (Mnih and Kavukcuoglu, 2013). Слово 
в данном случае всего одно, хотя и может выбираться из большого словаря.
Применение NCE к задачам с большим числом случайных величин менее эффек-
тивно. Классификатор на основе логистической регрессии может отклонить зашум-
ленный пример, выявив всего одну переменную с маловероятным значением. Это 
означает, что обучение сильно замедляется, после того как 
p
model
обучилось базовой 
маргинальной статистике. Представьте себе обучение модели изображений лиц, в ко-
торой в качестве 
p
noise
используется неструктурированный гауссов шум. Если 
p
model
обучилась распознавать глаза, то она может отклонять почти все зашумленные при-
меры, так ничего и не узнав о других признаках лица, например ртах.
Ограничение на простоту вычисления и выборки из 
p
noise
может оказаться чрез-
мерно строгим. Если распределение 
p
noise
простое, то большинство примеров, скорее 
всего, будет слишком очевидно отличаться от данных, так что заметного улучшения 
p
model
достичь не удастся.
Подобно сопоставлению рейтингов и псевдоправдоподобию, NCE не работает, 
если известна только нижняя граница 
p
~. Нижнюю границу можно было бы использо-
вать для получения нижней границы 
p
joint
(
y
= 1 | 

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   643   644   645   646   647   648   649   650   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish