Я. Гудфеллоу, И. Бенджио, А. Курвилль


x ~ p � data [log  p � data ( x



Download 14,23 Mb.
Pdf ko'rish
bet147/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   143   144   145   146   147   148   149   150   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

x
~
p

data
[log 
p

data
(
x
) – log 
p
model
(
x
)].
 
(5.60)
Первый член разности в квадратных скобках зависит только от порождающего 
данные процесса, но не от модели. Следовательно, при обучении модели, минимизи-
рующей расхождение КЛ, мы должны минимизировать только величину
– 
𝔼
x

p

data
[log 
p
model
(
x
)], 
(5.61)
а это, конечно, то же самое, что максимизация величины (5.59).
Минимизация расхождения КЛ в точности соответствует минимизации пере-
крестной энтропии между распределениями. Многие авторы употребляют термин 
«перекрестная энтропия» для обозначения исключительно отрицательного логариф-
мического правдоподобия распределения Бернулли или softmax, но это неправильно. 
Любая функция потерь, содержащая отрицательное логарифмическое правдоподо-
бие, является перекрестной энтропией между эмпирическим распределением, опре-
деляемым обучающим набором, и распределением, определяемым моделью. Напри-
мер, среднеквадратическая ошибка – перекрестная энтропия между эмпирическим 
распределением и гауссовой моделью.
Таким образом, мы видим, что максимальное правдоподобие – это попытка совмес-
тить модельное распределение с эмпирическим распределением 
p

data
. В идеале мы хо-
тели бы совпадения с истинным порождающим распределением 
p
data
, но непосред-
ственного доступа к нему у нас нет.
Хотя оптимальное значение 
θ
не зависит от того, максимизируем мы правдоподобие 
или минимизируем расхождение КЛ, значения целевых функций различны. При раз-
работке программ мы часто называем то и другое минимизацией функции стоимости. 
В таком случае поиск максимального правдоподобия становится задачей минимиза-
ции отрицательного логарифмического правдоподобия (ОЛП), или, что эквивалент-
но, минимизации перекрестной энтропии. Взгляд на максимальное правдоподобие 
как на минимальное расхождение КЛ в этом случае становится полезен, потому что 
известно, что минимум расхождения КЛ равен нулю. А отрицательное логарифмиче-
ское правдоподобие может принимать отрицательные значения при вещественных 

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   143   144   145   146   147   148   149   150   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish