Ын Анналин, Су Кеннет


Важные, но малые кластеры могут быть поглощены



Download 10,36 Mb.
Pdf ko'rish
bet39/90
Sana25.02.2022
Hajmi10,36 Mb.
#268392
1   ...   35   36   37   38   39   40   41   42   ...   90
Bog'liq
Теоретический минимум Big Data Всё, что нужно знать о больших данных

Важные, но малые кластеры могут быть поглощены. 
Итеративный процесс слияния кластеров может приве-
сти к тому, что значимые, но небольшие кластеры будут 
обойдены вниманием. Чтобы избежать этого, мы можем 
при необходимости проверять идентифицированные 
кластеры на промежуточных фазах итераций.
Множество возможных кластерных конфигураций. Для 
сетей, содержащих перекрывающиеся или вложенные 
кластеры, определить оптимальное кластерное решение 
может оказаться трудным. Тем не менее, когда имеются 
несколько решений с высокой модулярностью, мы мо-
жем сверить кластеры с другими информационными 
источниками, что мы и проделали на рис. 2, приняв во 
внимание географическое местоположение и политиче-
скую идеологию.


86
Глава 5
. 
Анализ социальных сетей
5.4. Алгоритм PageRank
Поскольку кластеры выявляют области высокой кон-
центрации взаимодействий, эти взаимодействия могут 
управляться ведущими узлами, вокруг которых эти 
кластеры и сформированы. Для определения этих до-
минирующих узлов мы можем использовать их ранжи-
рование.
Алгоритм PageRank, названный по имени сооснователя 
Google Ларри Пейджа, стал одним из первых алгоритмов 
Google для ранжирования веб-сайтов. Хотя мы и опишем 
PageRank в контексте ранжирования веб-сайтов, он мо-
жет быть использован для того, чтобы классифицировать 
узлы любого типа.
Значение PageRank для веб-сайта определяется тремя 
факторами.

Число ссылок. Если на один веб-сайт ссылаются дру-
гие, то он, скорее всего, привлекает больше пользова-
телей.

Сила ссылок. Чем чаще переходят по этим ссылкам, 
тем больше трафик сайта.

Источник ссылок. Ранг веб-сайта повышается и от-
того, что на него ссылаются другие высокоранговые 
сайты.
Чтобы увидеть работу PageRank, посмотрим на пример 
сети на рис. 4, где узлы представляют веб-сайты, а ре-
бра — гиперссылки.


5.4. Алгоритм PageRank
87
Входящая гиперссылка с большим весом означает боль-
ший объем трафика для сайта. На рис. 4 видно, что по-
сетитель сайта M с вдвое большей вероятностью посетит 
сайт D, чем J, и может никогда не посетить сайт T.












Рис. 4. Сеть, в которой узлы — это веб-сайты,
а ребра — гиперссылки
Чтобы понять, какой сайт привлекает больше пользовате-
лей, мы можем смоделировать поведение сайта из рис. 4 
для 100 пользователей и посмотреть, на какой сайт они 
в итоге попадут.
Сначала мы равно распределим 100 пользователей по 
четырем веб-сайтам, как показано на рис. 5.
Затем мы перераспределим пользователей каждого сайта 
в соответствии с его исходящими ссылками. Например, 
две трети пользователей сайта M отправятся на сайт D
в то время как оставшаяся треть посетит сайт J. Ребра на 
рис. 6 показывают число приходящих и уходящих поль-
зователей для каждого сайта.



Download 10,36 Mb.

Do'stlaringiz bilan baham:
1   ...   35   36   37   38   39   40   41   42   ...   90




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish