JavaScript для глубокого обучения 2021 TensorFlow js Ббк



Download 30,75 Mb.
Pdf ko'rish
bet234/457
Sana27.03.2022
Hajmi30,75 Mb.
#513488
1   ...   230   231   232   233   234   235   236   237   ...   457
Bog'liq
Цэй Ш., Байлесчи С., и др. - JаvaScript для глубокого обучения (Библиотека программиста) - 2021


Глава 6. Работа с данными
277
формы, требующий наличия значения в каждой ячейке. Существует четыре основ­
ных методики решения проблемы отсутствующих данных.
Простейший из этих методов, применимый в том случае, когда обучающих 
данных много, а пропущенные поля — редкость, состоит в отбросе тех обучающих 
примеров данных, в которых отсутствуют какие­либо данные. Впрочем, учтите, что 
при использовании этого метода можно ненароком внести в модель систематическую 
ошибку. Для большей наглядности представьте себе задачу, в которой отсутству­
ющие данные из позитивного класса встречаются намного чаще, чем из негативного. 
В результате модель усвоит неправильные вероятности классов. Спокойно отбра­
сывать примеры данных можно лишь тогда, когда отсутствующие данные относятся 
к категории MCAR.
Листинг 6.21.
Решение проблемы отсутствующих признаков путем удаления данных
Еще одна методика решения проблемы отсутствия данных, известная как 
под-
становка
(imputation), — заполнение пропущенных полей каким­либо значением. 
В числе распространенных методов подстановки — замена отсутствующих значе­
ний числовых признаков средним, медианным или модальным значением этого 
признака. Вместо отсутствующих категориальных признаков можно указать чаще 
всего встречающееся значение (моду). Более сложные методики включают созда­
ние и использование предикторов для отсутствующих признаков на основе име­
ющихся признаков. Фактически нейронные сети представляют собой одну из таких 
«сложных методик» подстановки отсутствующих данных. Недостаток подстановки 
состоит в том, что обучаемая модель не знает, что признак отсутствовал. Если само 
отсутствие значения несло какую­либо информацию о целевой переменной, то при 
подстановке эта информация теряется.
Листинг 6.22.
Решение проблемы отсутствующих признаков с помощью подстановки


278
Download 30,75 Mb.

Do'stlaringiz bilan baham:
1   ...   230   231   232   233   234   235   236   237   ...   457




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish