Практическая работа №4 сегментация клиентов телекоммуникационной компании с применением дедуктора


Вопросы на защиту практической работы



Download 97,77 Kb.
bet4/6
Sana22.03.2023
Hajmi97,77 Kb.
#920637
TuriПрактическая работа
1   2   3   4   5   6
Bog'liq
4 практика кластеризация

Вопросы на защиту практической работы:

      1. В чем суть/порядок работы алгоритма кластеризации - метод k-средних?

      2. Что такое тестовое и обучающее множество?

      3. Нужно ли перед началом выполнения кластеризации по методу k-средних задавать количество кластеров?

      4. Из каких шагов состоит алгоритм кластеризации k-средних?

      5. Что стремятся минимизировать в процессе выполнения алгоритма кластеризации k-средних?

      6. Что такое центр кластера в алгоритме k-means?

      7. Что можно взять в качестве меры расстояния между объектами при их кластеризации? Что берется в качестве меры расстояния между объектами при их кластеризации методом k-means в Дедукторе?

      8. Для фиксированных данных результат кластеризации при применении алгоритма k-means всегда будет одинаковым? всегда будет оптимальным?

      9. Зависит ли результат кластеризации при применении алгоритма k-means от выбора исходных центров кластеров?

      10. Достоинства и недостатки алгоритма k-means? Как “преодолевают” недостатки?

      11. Что позволяют узнать/увидеть следующие способы визуализации для кластеризации методом k-means в Дедуктор:

  • Что-если

  • Профили кластеров

  • Куб



Теоретический материал
https://basegroup.ru/deductor/function/algorithm/clustering
К наиболее простым и эффективным алгоритмам кластеризации относится k-means. Он состоит из четырех следующих шагов:
1. Задается число кластеров k, которое должно быть сформировано из объектов исходной выборки.
2. Случайным образом выбирается k записей, которые будут служить начальными центрами кластеров. Начальные точки, из которых потом вырастает кластер, часто называют «семенами». Каждая такая запись представляет собой своего рода «эмбрион» кластера, состоящий только из одного элемента.
3. Для каждой записи исходной выборки определяется ближайший к ней центр кластера.
4. Производится вычисление центроидов - центров тяжести кластеров. Это делается путем определения среднего для значения каждого признака всех записей в кластере. Затем старые центры кластеров смещаются в его центроид. Таким образом, центроиды становятся новыми центрами кластеров для следующей итерации алгоритма.

Как правило в реальных задачах наборы данных для кластеризации содержат большое количество числовых и категорийных атрибутов. Для процедуры кластеризации атрибуты являются входными данными. Все атрибуты, или признаки объектов делятся на числовые (numerical) и категорийные (categorical). Числовые атрибуты – это такие, которые могут быть упорядочены в пространстве, соответственно категорийные – это те, которые не могут быть упорядочены. Например, атрибут "возраст" – числовой, а "цвет" – категорийный.


Большинство алгоритмов кластеризации предполагают сравнение объектов между собой на основе некоторой меры близости (сходства). Мерой близости называется величина, имеющая предел и возрастающая с увеличением близости объектов. Меры сходства "изобретаются" по специальным правилам, а выбор конкретных мер зависит от задачи, а также от шкалы измерений. 
В качестве меры близости (или еще говорят – функции расстояния) для метода кластеризации k-means в Deductor использует:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish