Meta teglar
Meta teglar veb -sahifa egasiga aniqlik kiritish imkonini beradi kalit so'zlar va uning mazmunining mohiyatini belgilaydigan tushunchalar. Bu juda foydali vosita, ayniqsa, bu kalit so'zlar sahifa matnida 2-3 martagacha takrorlanishi mumkin. Bunday holda, meta teglar qidiruv robotini sahifani indeksatsiya qilish uchun kerakli kalit so'zlarga "yo'naltirishi" mumkin. Sahifaning o'zi mazmuniga hech qanday aloqasi bo'lmagan mashhur qidiruv so'rovlari va tushunchalaridan tashqari meta teglarni "aldash" mumkin. Qidiruv robotlari, masalan, meta teglar va veb -sahifalar tarkibining o'zaro bog'liqligini tahlil qilish, sahifalarning mazmuniga mos kelmaydigan meta teglarni (mos ravishda kalit so'zlarni) "tashlab yuborish" orqali bunga qarshi kurasha oladi.
Bularning barchasi, agar veb -resurs egasi haqiqatan ham kerakli so'zlarni qidirish natijalariga qo'shilishni xohlasa. Ammo tez -tez shunday bo'ladiki, egasi robot tomonidan indekslanishni umuman xohlamaydi. Ammo bunday holatlar bizning maqolamiz mavzusi bilan bog'liq emas.
Indeks yaratish
O'rgimchaklar o'z ishlarini yangi veb -sahifalarni topish ishlarini tugatgandan so'ng, qidiruv tizimlari kelajakda foydalanish uchun qulay bo'lishi uchun ular topgan barcha ma'lumotlarni joylashtirishi kerak. 2 ta asosiy komponent mavjud: Ma'lumotlar bilan birga saqlanadigan ma'lumotlar;
- bu ma'lumotni indekslash usuli. Oddiy holatda, qidiruv tizimi so'z va URL manzilini joylashtirishi mumkin. Ammo bu qidiruv tizimini mutlaqo ibtidoiy asbobga aylantiradi, chunki bu so'z hujjatning qaysi qismida joylashganligi (meta teglar yoki oddiy matnda), bu so'z bir marta yoki takror ishlatilgani haqida ma'lumot yo'q. boshqa muhim va tegishli manbaga havolada mavjud. Boshqacha aytganda, bu usul saytlarni reytingga qo'yishga yo'l qo'ymaydi, foydalanuvchilarga tegishli natijalarni bermaydi va hokazo.
Bizga foydali ma'lumotlarni taqdim etish uchun qidiruv tizimlari so'z va uning URL manzilidan boshqa ma'lumotlarni saqlaydi. Поисковик может сохранить данные о количестве (частоте) упоминаний слова на странице, присвоить слову "вес", что далее поможет выдавать поисковые листинги (результаты) на основе весового ранжирования по данному слову, с учетом его местонахождения (в ссылках, мета тегах, титуле страницы va h.k.). Har bir tijorat qidiruv tizimida indeksatsiya paytida kalit so'zlarning "og'irligi" ni hisoblash uchun o'z formulasi mavjud. Bu qidiruv tizimlari bir xil qidiruv so'rovi uchun mutlaqo boshqacha natijalar berishining sabablaridan biridir.
Keyingi muhim nuqta topilgan ma'lumotni qayta ishlashda, uni saqlash uchun disk maydonini kamaytirish maqsadida kodlangan. Masalan, Google -ning asl maqolasida so'zlarning og'irlik ma'lumotlarini saqlash uchun 2 bayt (har biri 8 bit) ishlatilganligi tasvirlangan - bu so'zning turini (katta yoki katta harflar bilan), o'lchamini hisobga oladi. harflarning o'zi (Font-Size) va boshqa ma'lumotlar, bu saytni reytingini aniqlashga yordam beradi. Har bir bunday "ma'lumot" bo'lagi to'liq 2 baytli to'plamda 2-3 bit ma'lumotni talab qiladi. Natijada, juda katta hajmdagi ma'lumotlarni juda ixcham shaklda saqlash mumkin. Ma'lumot "siqilgan" bo'lgandan so'ng, indekslashni boshlash vaqti keldi.
Indekslashning maqsadi bitta: iloji boricha tezroq qidirishni ta'minlash sizga kerak bo'lgan ma'lumotlar... Indekslarni tuzishning bir necha yo'li bor, lekin eng samarali - bu qurish xash jadvallari(xash jadvali). Hashing har bir so'zga raqamli qiymat beradigan formuladan foydalanadi.
Har qanday tilda alifboning qolgan qismiga qaraganda ko'proq so'zlar boshlanadigan harflar mavjud. Masalan, inglizcha lug'at bo'limida "X" harfiga qaraganda "M" harfi bo'lgan so'zlar ancha ko'p. Bu shuni anglatadiki, eng mashhur harf bilan boshlanadigan so'zni topish boshqa so'zlarga qaraganda ko'proq vaqt talab etadi. Hashing(Hashing) bu farqni tenglashtiradi va qidirishning o'rtacha vaqtini kamaytiradi, shuningdek indeksning o'zini haqiqiy ma'lumotlardan ajratadi. Xash jadvali xash qiymatlarini va shu qiymatga mos keladigan ma'lumotlarga ko'rsatgichni o'z ichiga oladi. Samarali indeksatsiya + birgalikda joylashtirishni ta'minlaydi yuqori tezlik qidirish, hatto foydalanuvchi juda murakkab qidiruv so'rovini so'rasa ham.
Do'stlaringiz bilan baham: |