Я. Гудфеллоу, И. Бенджио, А. Курвилль


идентифицируемости модели



Download 14,23 Mb.
Pdf ko'rish
bet307/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   303   304   305   306   307   308   309   310   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение

идентифицируемости модели
. Говорят, что модель идентифицируемая, 
если существует достаточно большой обучающий набор, который может исключить 
все конфигурации параметров модели, кроме одной. Модели с латентными перемен-
ными часто не являются идентифицируемыми, потому что мы можем получить эк-
вивалентные модели, меняя латентные переменные местами. Например, можно было 
бы взять нейронную сеть и модифицировать слой 1, заменив входящий вектор весов 
для блока 
i
входящим векторов весов для блока 
j
и наоборот, а затем проделав то же 
самое для исходящих векторов весов. Если имеется 
m
слоев по 
n
блоков в каждом, то 
существует 
n
!
m
способов упорядочить скрытые блоки. Такой вид неидентифицируе-
мости называется 
симметрией пространства весов
.
Помимо симметрии пространства весов, во многих разновидностях нейронных се-
тей есть и другие причины неидентифицируемости. Например, в любой сети с блока-
ми линейной ректификации или maxout-блоками можно умножить все входящие веса 
и смещения блока на 
α
, одновременно умножив исходящие веса на 1/
α
. Это означает, 
что если функция стоимости не включает таких членов, как снижение весов, которые 
напрямую зависят от весов, а не от выходов модели, то все локальные минимумы сети 
лежат на (
m
×
n
)-мерном гиперболоиде эквивалентных локальных минимумов.
Проблема идентифицируемости модели означает, что функция стоимости нейрон-
ной сети может иметь очень большое, даже несчетное, множество локальных миниму-
мов. Однако все локальные минимумы, проистекающие из неидентифицируемости, 
эквивалентны между собой с точки зрения значения функции стоимости. Поэтому 
такое проявление невыпуклости не составляет проблемы.
Локальные минимумы становятся проблемой, если значение функции стоимости 
в них велико, по сравнению со значением в глобальном минимуме. Можно постро-
ить небольшую нейронную сеть, даже без скрытых блоков, в которой стоимость в ло-
кальных минимумах будет выше, чем в глобальном (Sontag and Sussman, 1989; Brady 
et al., 1989; Gori and Tesi, 1992). Если локальные минимумы с высокой стоимостью 
встречаются часто, то градиентные алгоритмы оптимизации сталкиваются с серьез-
ной проблемой.
Вопрос о том, много ли локальных минимумов с высокой стоимостью в практиче-
ски интересных сетях и наталкиваются ли на них алгоритмы оптимизации, остается 
открытым. В течение многих лет среди практиков бытовало мнение, что локальные 
минимумы – распространенная проблема, преследующая оптимизацию нейронных 



Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   303   304   305   306   307   308   309   310   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish