Ўзбекистон республикаси ахборот технологиялари ва коммуникацияларни ривожлантириш вазирлиги тошкент ахборот технологиялари университети



Download 14,5 Mb.
Pdf ko'rish
bet110/230
Sana19.04.2022
Hajmi14,5 Mb.
#563572
1   ...   106   107   108   109   110   111   112   113   ...   230
Bog'liq
internet tarmoqlari va xizmatlari yangi pedagogik texnologiyaga asoslangan (1)

21.2. Ҳужжатларни даражалаш мезонлари
Қидирув тизимларида ҳужжатларга ҳаволалар сўровларга
москелишига қараб сараланади (ранжируются). Қидирув беришида 
саҳифаларни саралаш учун текст мезонлари, ҳавола мезонлари, 
фойдаланиш баҳолари мезонлари қўлланилади.
Текст мезонлари сўровларда, матнларда, саҳифа сарлавҳасида
сўзлар мослиги бўйича ҳужжат релевантлиги мезонларини аниқлаб 
беради.


204 
Ҳужжат релевантлиги – ҳужжат мазмуни билан қидирув тизимининг
аниқ сўровлари мос келишини акс эттирувчи кўрсаткич. 
Қидирув тизимлари ҳужжатларнинг релевантлигини ҳисоблайди, 
саҳифада учрайдиган сўз ва сўз бирикмаларининг частота қаторини
қуради. Ҳужжатларда қанчалик кўп учраса, фойдаланувчи сўровларига
шунчалик кўп релевантлик олади.
Қидирув тизимлари ҳужжатлар Web-саҳифалари релевантлигининг
камайиш тартиби 10-20 тадан қисмларга бўлиниб ҳаволаларни акс
эттиради. Маркетинг тадқиқот маълумотлари натижаларига кўра 60% га
яқин фойдаланувчилар қидирув натижаларининг биринчи саҳифаси билан
ва 90% –га яқини биринчи учта саҳифа билан чегараланиб қолади.
Бундан сайтпромоутинг бўйича мутахассислар учун вазифа келиб чиқади –
сўровнинг қурилишидан қатъий назар Web-сайт саҳифалари қидирувнинг 
биринчи 10-20 натижасида туришига эришиш керак . 
Ҳужжатларни саралаш асосий матн мезонлари 21.1.- жадвалда
келтирилган.
21.1-жадвал 
Ҳужжатлар саралашни матнли мезонлари 
Мезонлар
Саралаш мантиқи 
Сўз «оғирлиги»
Ҳужжатда сўзни такрорлаш частотаси юқори
бўлса, ҳужжатнинг даражаси юқори бўлади 
Сўзларнинг ўзаро вазияти 
Ибора ёки унга ўхшаш сўзларнинг тўлиқ
мослигини 
ҳисобини 
олб 
бориш 
(масалан,сўзларнинг бир-бирига яқинлиги ва 
тартиби) 
Топилган матннинг ҳужжат
бошига нисбатан ҳолати 
Ҳужжатнинг бошланишига ахборот қанчалик 
яқин бўлса, унинг мазмуни юқори бўлади деб
ҳисобланади.
Ажратилган фрагментлар ва 
сарлавҳаларда 
сўров
сўзларининг мавжудлиги 
Ажратилган фрагментларда қидирилаётган
матнларни топишнинг аҳамияти оддий
матндагига нисбатан юқори ҳисобланади 
Саҳифа мавзусининг сўров
мавзуси билан мослиги 
Сўров 
матнида 
бўлмаган, 
аммо 
сўров
мавзусига мос келувчи сўзларни қидирувда
қўллаш 
Домен номи ёки файли билан
калит сўзнинг мослиги 
Қидирув машиналари саҳифаларга қўшимча 
«оғирлик» беради, уларда домен ёки файл 
номи калит сўз билан мос келади. 
Қидирув 
сўровларининг 
каталог 
таърифи 
билан
мослиги 
Агар қидирув сўровларининг сўзлари каталог 
таърифи билан мос бўлса, сайт юқори
рейтинг олади.


205 
Кам учрайдиган сўзларнинг
аҳамияти 
Қидирув сўзлари ҳужжатда қанча кам учраса, 
унинг аҳамияти ортиб боради 
Матн фрагментларини баҳолаш аҳамиятини Г.Лун ишлаб чиққан.
У матн фрагментларини қуйидаги ифода орқали баҳолашни таклиф
қилган: 
бу ерда: V – фрагмент аҳамияти; Nk – ушбу фрагментда калит сўзларнинг
сони; NO – фрагментдаги сўзларнинг умумий сони. 
Калит сўзларни аниқлаш тизими, одатда статистик частота
таҳлилини қўллайди (В. Пурто методикаси). Агар: 
F– матнда турли сўзлар учратйдиган частота; 
P–фойдалиликнинг нисбий қиймати (муҳимлик); 
C – сўзлар частотаси ва уларнинг фойдалилиги ўзаро нисбатини
аниқловчи константа. 
Шунда F (P) боғлиқлиги қуйидаги формула орқали аниқланади: 
Берилган ҳолат частотанинг икки чегаравий аҳамияти 
мавжудлигини тахмин қилади: 

қуйи чегарадан кам частотага эга сўзлар жуда камёб
ҳисобланади (ҳужжат мазмунини акс эттиришга қодир эмас), 
юқори чегарадан ўтиб кетувчи частоталиклар эса умумий, 
маънавий юкланишга эга эмас деб ҳисобланади; 

Бу икки чегара орасидаги частотага эга сўзлар эса берилган
аниқ ҳужжат мазмунини ифодалайди.
Ҳавола критерияларига асосан ҳужжат цитата олиш индекси 
ҳисобидан сараланади.
Цитата олиш индекси – бу сайтнинг Интернетда машҳурлиги
кўрсаткичи, қидирилаётган ресурсда бошқа сайтларга ҳаволаларнинг сони
ва аҳамияти билан аниқланади. Сайтга ташқи ҳаволаларнинг умумий сони 
цитаталаш ҳисоблари учун критерийлар сифатида тўғри келмайди, чунки
машҳур бўлмаган ресурсларга ҳаволаларнинг аҳамияти машҳур сайтлар 
ҳаволалари аҳамиятига қараганда жуда оз.
Цитаталаш индексини аниқлашда нафақат сайтга ташқи ҳаволалар
сони эътиборга олинади, балки маълумотга ҳавола этилган ўз 
сайтларининг цитаталаш индексига эътибор берилади. Анча қимматли
ҳаволалар – юқори цитатали сайтларнинг бош саҳифасида жойлашган
ҳаволалар. Умумий ҳолатда Web- саҳифага ҳар бир тўғри ҳавола ҳажм
бўйича цитаталашни кўпайтиради, ҳажм ҳавола қилинувчи саҳифага 
цитаталашга пропорционал ва акси ҳавола этилаётган саҳифада ҳаволалар 


206 
умумий сонига пропорционал бўлади.
Ўз вақтида икки америкалик аспирантлар Сергей Бринва Ларри 
Пейдж 1997 йил Google қидирув машинасини асослаб берган, тармоқда 
ҳужжатлар бўйича фойдаланувчи ҳаракатини эмуляция қилувчи модель
ишлаб чиқилган. Бундан тахмин қилинадики, тенг эҳтимолликка эга 
фойдаланувчи ҳужжатда мавжуд бўлган, айнан шу вақтда кўриб
чиқаётган исталган ҳаволалар бўйича ўтиши мумкин. Шунингдек 
фойдаланувчининг аниқ ҳужжатга тушиш эҳтимоли бошқа ҳужжатлардан 
унга ҳавола этиладиганлар сонига ва ҳавола этилаётган ҳужжатларда
фойдаланувчи бўлиш эҳтимоли ҳамда бу ҳужжат қанча чиқиш
ҳаволаларига эга эканлигига боғлиқ. Бу эҳтимолик саҳифа нуфузи ёки
даражаси кўрсаткичи сифатида қабул қилинган (PageRank):
бу ерда: 

Download 14,5 Mb.

Do'stlaringiz bilan baham:
1   ...   106   107   108   109   110   111   112   113   ...   230




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish