Ын Анналин, Су Кеннет



Download 10,36 Mb.
Pdf ko'rish
bet15/90
Sana25.02.2022
Hajmi10,36 Mb.
#268392
1   ...   11   12   13   14   15   16   17   18   ...   90
Bog'liq
Теоретический минимум Big Data Всё, что нужно знать о больших данных

1.3. Настройка параметров
Многочисленные алгоритмы, доступные в Data Science, 
естественно приводят к огромному числу потенциаль-
ных моделей, которые мы можем построить. Но даже 
один такой алгоритм способен генерировать различные 
результаты в зависимости от настройки его параметров.
Параметры — это тонкая регулировка алгоритма, по-
хожая на настройку радиоприемника на нужную волну. 


32
Глава 1
. 
Об основах без лишних слов
У разных алгоритмов свои параметры настройки. Общие 
параметры алгоритмов можно найти в приложении C.
Излишне говорить, что точность модели проигрывает, 
если параметры настроены несообразно. Посмотрите 
на рис. 2, чтобы увидеть, как алгоритм классификации 
может сгенерировать различные границы для разделения 
оранжевых и голубых точек.
a) переобучение
b) идеальное 
распределение
c) недообучение
Рис. 2. Сравнение результатов предсказания
для одного и того же алгоритма с разными параметрами
На рис. 2, а алгоритм слишком чувствителен и прини-
мает случайные отклонения данных за закономерности. 
Эта проблема известна как переобучение (overfitting). 
Такая модель точна для прогнозирования по уже име-
ющимся данным, но меньше подходит для будущей 
информации.
На рис. 2, с алгоритм, наоборот, слишком нечувствите-
лен и основные закономерности упустил. Эта проблема 
известна как недообучение (underfitting). Такая модель 
способна пренебрегать важными тенденциями и дает 


1.4. Оценка результатов
33
менее точные предсказания как для текущих, так и для 
будущих данных.
Но когда параметры настроены хорошо, как на рис. 2, b, 
алгоритм достигает равновесия, определяя главные тен-
денции, сбрасывая со счетов мелкие отклонения и пред-
лагая хорошую прогностическую модель.
Чаще всего постоянной задачей становится переобучение. 
В попытках свести к минимуму ошибки прогнозирования 
мы можем поддаться искушению увеличить сложность 
модели. В конечном счете это приводит к результатам, 
похожим на показанные на рис. 2, а — границы проведены 
тонко, но избыточно.
Одним из способов держать под контролем сложность 
модели является введение штрафного параметра в про-
цессе регуляризации. Этот новый параметр штрафует 
модель за сложность, искусственно увеличивая погреш-
ность и этим побуждая алгоритм находить оптимальное 
соотношение точности со сложностью. Тем самым со-
храняя простоту модели, мы можем обеспечить ее мас-
штабируемость.

Download 10,36 Mb.

Do'stlaringiz bilan baham:
1   ...   11   12   13   14   15   16   17   18   ...   90




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish