1 Свойства и структура алгоритма


 Входные и выходные данные алгоритма



Download 1,14 Mb.
bet7/12
Sana13.04.2022
Hajmi1,14 Mb.
#548151
1   2   3   4   5   6   7   8   9   ...   12
Bog'liq
Алгоритм k средних

1.9 Входные и выходные данные алгоритма


Входные данные

  • Матрица из n⋅d элементов xi,j∈R, i=1,...,n, j=1,...,d, – координат векторов (наблюдений).

  • Целое положительное число k, k≤n – количество кластеров.

Объем входных данных
1 целое число + n⋅d вещественных чисел (при условии, что координаты – вещественные числа).
Выходные данные
n целых положительных чисел L1,...,Ln– номера кластеров, соотвествующие каждому вектору (при условии, что нумерация кластеров начинается с 1).
Объем выходных данных
n целых положительных чисел.

1.10 Свойства алгоритма


Вычислительная мощность
Вычислительная мощность алгоритма k-means равна ikdnnd=ki, где k – число кластеров, i – число итераций алгоритма.
Детерминированность и Устойчивость
Алгоритм k-means является итерационным. Количество итераций алгоритма в общем случае не фиксируется и зависит от начального расположения объектов в пространстве, параметра k, а также от начального приближения центров кластеров, μ1,...,μk. В результате этого может варьироваться результат работы алгоритма. При неудачном выборе начальных параметров итерационный процесс может сойтись к локальному оптимуму[8]. По этим причинам алгоритм не является ни детермирированным, ни устойчивым.
Соотношение последовательной и параллельной сложности алгоритма
Θk−meansΨk−means=O(ikdn)O(i⋅log(kdn))
Сильные стороны алгоритма:

  • Сравнительно высокая эффективность при простоте реализации

  • Высокое качество кластеризации

  • Возможность распараллеливания

  • Существование множества модификаций

Недостатки алгоритма[9]:

  • Количество кластеров является параметром алгоритма

  • Чувствительность к начальным условиям

Инициализация центров кластеров в значительной степени влияет на результат кластеризации.

  • Чувствительность к выбросам и шумам

Выбросы, далекие от центров настоящих кластеров, все равно учитываются при вычислении их центров.

  • Возможность сходимости к локальному оптимуму

Итеративный подход не дает гарантии сходимости к оптимальному решению.

  • Использование понятия "среднего"

Алгоритм неприменим к данным, для которых не определено понятие "среднего", например, категориальным данным.

Download 1,14 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   12




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish