Ын Анналин, Су Кеннет



Download 10,36 Mb.
Pdf ko'rish
bet52/90
Sana25.02.2022
Hajmi10,36 Mb.
#268392
1   ...   48   49   50   51   52   53   54   55   ...   90
Bog'liq
Теоретический минимум Big Data Всё, что нужно знать о больших данных

114
Глава 7
. 
Метод k -ближайших соседей
что красные вина неверно определяются как белые из-за 
необычно высокого содержания диоксида серы. Если нам 
известно, что данные вина требуют большего содержания 
этого консерванта из-за низкого уровня кислотности, то 
мы можем принять во внимание кислотность вина для 
улучшения прогнозирования.
Аномалии могут быть вызваны пропущенными предикто-
рами, иногда их причиной является недостаток данных 
для обучения модели. Чем меньше элементов данных 
у нас есть, тем сложнее распознать закономерности в дан-
ных, из-за чего очень важно убедиться в том, что их объем 
соответствует задачам моделирования.
Как только аномалии определены, они могут быть удале-
ны из набора данных перед обучением прогностической 
модели. Это снизит уровень шума в данных и увеличит 
точность прогнозирования.
7.5. Ограничения
Хотя метод k-ближайших соседей прост и эффективен, 
нужно учесть, что для некоторых случаев он может ока-
заться не самым удачным выбором.
Не классы. Если имеется множество классов и эти клас-
сы существенно отличаются по размеру, то элементы 
данных, принадлежащие к самому небольшому из них, 
могут быть ошибочно включены в более крупные. Чтобы 
улучшить точность, можно и здесь использовать вместо 
равновесного вычисления весовые параметры, которые 


7.6. Краткие итоги
115
позволят больше ориентироваться на ближайшие эле-
менты данных, а не на отдаленные.
Избыток предикторов. Если предикторов слишком мно-
го, для определения ближайших соседей в нескольких 
измерениях могут потребоваться долгие вычисления. 
Более того, некоторые предикторы могут быть лишними 
и не улучшать точность прогноза. Чтобы исключить это, 
для выявления наиболее существенных предикторов для 
анализа можно воспользоваться уменьшением размер-
ности (см. главу 3).

Download 10,36 Mb.

Do'stlaringiz bilan baham:
1   ...   48   49   50   51   52   53   54   55   ...   90




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish