Ын Анналин, Су Кеннет



Download 10,36 Mb.
Pdf ko'rish
bet27/90
Sana25.02.2022
Hajmi10,36 Mb.
#268392
1   ...   23   24   25   26   27   28   29   30   ...   90
Bog'liq
Теоретический минимум Big Data Всё, что нужно знать о больших данных

60
Глава 3
. 
Метод главных компонент
овощных товаров низкое содержание жиров у морепро-
дуктов, поэтому значение компоненты 2 для них меньше, 
и сами они тяготеют к нижней части графика. Схожим 
образом у тех овощей, которые не являются зеленью, 
низкие значения компоненты 2, что видно в нижней части 
графика справа.
Выбор количества компонент. В этом примере созданы 
четыре главных компоненты по числу изначальных пере-
менных в наборе данных. Поскольку главные компоненты 
создаются на основе обычных переменных, информация 
для распределения элементов данных ограничивается их 
первоначальным набором.
Вместе с тем для сохранения простоты и масштабируемо-
сти результатов нам следует выбирать для анализа и ви-
зуализации только несколько первых главных компонент. 
Главные компоненты отличаются по эффективности 
распределения элементов данных, и первый из них делает 
это в максимальной степени. Число главных компонент 
для рассмотрения определяют с помощью графика осыпи
который мы рассмотрели в предыдущей главе.
График показывает снижающуюся эффективность по-
следующих главных компонент в дифференцировании 
элементов данных. Как правило, используется такое 
количество главных компонент, которое соответствует 
положению острого излома на графике осыпи.
На рис. 7 излом расположен на отметке в две компоненты. 
Это означает, что хотя три и более главных компонент 
могли бы лучше дифференцировать элементы данных, 


3.4. Ограничения
61
0
10
20
30
40
50
0
1
2
3
4
% учтенного разброса данны
х
Число компонент
Рис. 7. На графике осыпи виден излом, обозначающий,
что оптимальное число главных компонент — две
эта дополнительная информация может не оправдать 
сложности итогового решения. Как видно из графи-
ка осыпи, две первые главные компоненты уже дают 
70 %-ный разброс. Использование небольшого числа 
главных компонент для анализа данных дает гарантию 
того, что схема подойдет и для будущей информации.

Download 10,36 Mb.

Do'stlaringiz bilan baham:
1   ...   23   24   25   26   27   28   29   30   ...   90




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish