Я. Гудфеллоу, И. Бенджио, А. Курвилль



Download 14,23 Mb.
Pdf ko'rish
bet124/779
Sana14.06.2022
Hajmi14,23 Mb.
#671946
TuriКнига
1   ...   120   121   122   123   124   125   126   127   ...   779
Bog'liq
Гудфеллоу Я , Бенджио И , Курвилль А Глубокое обучение


разделах мы опишем базовые принципы, лежащие в основе проектирования алгорит-
мов обучения, и продемонстрируем, как эти принципы применяются к построению 
более сложных алгоритмов.
5.2. Емкость, переобучение и недообучение
Главная проблема машинного обучения состоит в том, что алгоритм должен хорошо 
работать на новых данных, которых он раньше не видел, а не только на тех, что ис-
пользовались для обучения модели. Эта способность правильной работы на ранее не 
предъявлявшихся данных называется 
обобщением
.


106 

 
Основы машинного обучения 
Обычно при обучении модели мы имеем доступ к обучающему набору: можем вы-
числить некоторую меру ошибки на обучающем наборе, которая называется 
ошибкой 
обучения
, и постараться минимизировать ее. То, что мы только что описали, – всего 
лишь задача оптимизации. Машинное обучение отличается от оптимизации тем, что 
мы хотим еще и уменьшить 
ошибку обобщения
(ее также называют 
ошибкой тес-
тирования
). Ошибка обобщения – это математическое ожидание ошибки на новых 
входных данных. Здесь математическое ожидание вычисляется по возможным вход-
ным данным, выбираемым из распределения, которое, как мы думаем, может встре-
титься на практике.
Как правило, для оценки ошибки обобщения модели измеряется ее качество на 
тестовом наборе данных, отдельном от обучающего набора.
В примере линейной регрессии мы обучали модель путем минимизации следую-
щей ошибки обучения:
(5.14)
но в действительности нас интересует ошибка тестирования 
Как можно повлиять на качество работы на тестовом наборе, если для наблюдения 
доступен только обучающий набор? Некоторые ответы дает 
теория статистического 
обучения
. Если обучающий и тестовый наборы готовились произвольным образом, 
то действительно мало что можно сделать. Но если разрешено делать предположения 
о порядке сбора данных для обучающего и тестового наборов, то удается продвинуть-
ся дальше.
Обучающий и тестовый наборы генерируются из распределения вероятности тес-
товых наборов 

Download 14,23 Mb.

Do'stlaringiz bilan baham:
1   ...   120   121   122   123   124   125   126   127   ...   779




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish