O‘zbekiston respublikasi axborot texnologiyalari va kommunikatsiyalarini rivojlantirish vazirligi muhammad al-xorazmiy nomidagi toshkent axborot texnologiyalari universiteti farg’ona filiali kompyuter injiniringi fakulteti



Download 66,14 Kb.
bet7/10
Sana14.06.2022
Hajmi66,14 Kb.
#666772
1   2   3   4   5   6   7   8   9   10
Bog'liq
diruv robot

Meta teglar
Meta teglar veb -sahifa egasiga aniqlik kiritish imkonini beradi kalit so'zlar va uning mazmunining mohiyatini belgilaydigan tushunchalar. Bu juda foydali vosita, ayniqsa, bu kalit so'zlar sahifa matnida 2-3 martagacha takrorlanishi mumkin. Bunday holda, meta teglar qidiruv robotini sahifani indeksatsiya qilish uchun kerakli kalit so'zlarga "yo'naltirishi" mumkin. Sahifaning o'zi mazmuniga hech qanday aloqasi bo'lmagan mashhur qidiruv so'rovlari va tushunchalaridan tashqari meta teglarni "aldash" mumkin. Qidiruv robotlari, masalan, meta teglar va veb -sahifalar tarkibining o'zaro bog'liqligini tahlil qilish, sahifalarning mazmuniga mos kelmaydigan meta teglarni (mos ravishda kalit so'zlarni) "tashlab yuborish" orqali bunga qarshi kurasha oladi.
Bularning barchasi, agar veb -resurs egasi haqiqatan ham kerakli so'zlarni qidirish natijalariga qo'shilishni xohlasa. Ammo tez -tez shunday bo'ladiki, egasi robot tomonidan indekslanishni umuman xohlamaydi. Ammo bunday holatlar bizning maqolamiz mavzusi bilan bog'liq emas.
Indeks yaratish
O'rgimchaklar o'z ishlarini yangi veb -sahifalarni topish ishlarini tugatgandan so'ng, qidiruv tizimlari kelajakda foydalanish uchun qulay bo'lishi uchun ular topgan barcha ma'lumotlarni joylashtirishi kerak. 2 ta asosiy komponent mavjud: Ma'lumotlar bilan birga saqlanadigan ma'lumotlar;
- bu ma'lumotni indekslash usuli. Oddiy holatda, qidiruv tizimi so'z va URL manzilini joylashtirishi mumkin. Ammo bu qidiruv tizimini mutlaqo ibtidoiy asbobga aylantiradi, chunki bu so'z hujjatning qaysi qismida joylashganligi (meta teglar yoki oddiy matnda), bu so'z bir marta yoki takror ishlatilgani haqida ma'lumot yo'q. boshqa muhim va tegishli manbaga havolada mavjud. Boshqacha aytganda, bu usul saytlarni reytingga qo'yishga yo'l qo'ymaydi, foydalanuvchilarga tegishli natijalarni bermaydi va hokazo.
Bizga foydali ma'lumotlarni taqdim etish uchun qidiruv tizimlari so'z va uning URL manzilidan boshqa ma'lumotlarni saqlaydi. Поисковик может сохранить данные о количестве (частоте) упоминаний слова на странице, присвоить слову "вес", что далее поможет выдавать поисковые листинги (результаты) на основе весового ранжирования по данному слову, с учетом его местонахождения (в ссылках, мета тегах, титуле страницы va h.k.). Har bir tijorat qidiruv tizimida indeksatsiya paytida kalit so'zlarning "og'irligi" ni hisoblash uchun o'z formulasi mavjud. Bu qidiruv tizimlari bir xil qidiruv so'rovi uchun mutlaqo boshqacha natijalar berishining sabablaridan biridir.
Keyingi muhim nuqta topilgan ma'lumotni qayta ishlashda, uni saqlash uchun disk maydonini kamaytirish maqsadida kodlangan. Masalan, Google -ning asl maqolasida so'zlarning og'irlik ma'lumotlarini saqlash uchun 2 bayt (har biri 8 bit) ishlatilganligi tasvirlangan - bu so'zning turini (katta yoki katta harflar bilan), o'lchamini hisobga oladi. harflarning o'zi (Font-Size) va boshqa ma'lumotlar, bu saytni reytingini aniqlashga yordam beradi. Har bir bunday "ma'lumot" bo'lagi to'liq 2 baytli to'plamda 2-3 bit ma'lumotni talab qiladi. Natijada, juda katta hajmdagi ma'lumotlarni juda ixcham shaklda saqlash mumkin. Ma'lumot "siqilgan" bo'lgandan so'ng, indekslashni boshlash vaqti keldi.
Indekslashning maqsadi bitta: iloji boricha tezroq qidirishni ta'minlash sizga kerak bo'lgan ma'lumotlar... Indekslarni tuzishning bir necha yo'li bor, lekin eng samarali - bu qurish xash jadvallari(xash jadvali). Hashing har bir so'zga raqamli qiymat beradigan formuladan foydalanadi.
Har qanday tilda alifboning qolgan qismiga qaraganda ko'proq so'zlar boshlanadigan harflar mavjud. Masalan, inglizcha lug'at bo'limida "X" harfiga qaraganda "M" harfi bo'lgan so'zlar ancha ko'p. Bu shuni anglatadiki, eng mashhur harf bilan boshlanadigan so'zni topish boshqa so'zlarga qaraganda ko'proq vaqt talab etadi. Hashing(Hashing) bu farqni tenglashtiradi va qidirishning o'rtacha vaqtini kamaytiradi, shuningdek indeksning o'zini haqiqiy ma'lumotlardan ajratadi. Xash jadvali xash qiymatlarini va shu qiymatga mos keladigan ma'lumotlarga ko'rsatgichni o'z ichiga oladi. Samarali indeksatsiya + birgalikda joylashtirishni ta'minlaydi yuqori tezlik qidirish, hatto foydalanuvchi juda murakkab qidiruv so'rovini so'rasa ham.



Download 66,14 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish