Я. Гудфеллоу, И. Бенджио, А. Курвилль



Download 14,23 Mb.
Pdf ko'rish
bet485/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   481   482   483   484   485   486   487   488   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

12.4.3.3. Выборка по значимости
Ускорить обучение нейронных языковых моделей можно, в частности, избежав явно-
го вычисления вклада в градиент от всех слов, которые не встречаются в следующей 
позиции. У любого недопустимого слова должна быть низкая вероятность в модели. 
Перечисление всех таких слов стоит дорого. Но можно вместо этого выбрать лишь их 
подмножество. В обозначениях из формулы (12.8) градиент можно записать в сле-
дующем виде:
(12.13)
(12.14)
(12.15)
(12.16)
где 
a
– вектор активаций до применения softmax (оценок), по одному элементу на 
каждое слово. Первый член – 
положительная фаза
, толкающая 
a
y
вверх, второй 
член – 
отрицательная фаза
, толкающая 
a
i
вниз с весом 
P
(
i

C
) для всех 
i
. Поскольку 
отрицательная фаза – это математическое ожидание, то оценить ее можно по выборке 
Монте-Карло. Однако для этого потребовалось бы производить выборку из самой 
модели. Выборка из модели подразумевает вычисление 
P
(
i

C
) для всех 
i
в словаре, 
а это как раз то, чего мы хотим избежать.
Вместо выборки из модели мы можем произвести выборку из другого распреде-
ления, которое называется вспомогательным распределением (proposal distribution) 
и обозначается 
q
, и использовать подходящие веса для корректировки смещения 
вследствие выборки не из того распределения (Bengio and Se

ne

cal, 2003; Bengio and 
Se

ne

cal, 2008). Это пример применения более общей техники, называемой 
выборкой 
по значимости
, подробно она будет описана в разделе 17.2. К сожалению, даже точная 
выборка по значимости не эффективна, потому что требуется вычисление весов 
p
i
/
q
i

где 
p
i

P
(
i

C
), а их можно вычислить, только если вычислены все веса 
a
i
. Специально 
для данного приложения предложено решение, называемое 

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   481   482   483   484   485   486   487   488   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish