Internetdan taqsimlangan mavzularga oid ma’lumot qidirish
Ko'p sonli go'zal metaforalarni iste'mol qilishga shunchaki sevadigan odamlar bunday tur mavjud. Bu odamlar dunyo bo'ylab poligon bilan solishtirishadi. Go'yo tarmoqda hamma narsa katta bir dasta va la'natlanganda, bu oyog'ini sindirishi mumkin. Go'yo tarmoqda hamma narsa bor, lekin biror narsani topish uchun sizda haddan tashqari katta axlat tog'lari kerak.
Xo'sh, chiroyli metafora. Faqat bu haqiqat degani emas. Dasturda ko'p odamlar, birinchi qarashda juda ko'p foydasiz narsalar to'ldirildi. Ammo bu jadvallar ortida ishlaydigan odamlar uchun, narsalarning joylashuvi aniqlangan mantiqqa mos keladi. Ko'pincha kerak bo'lgan narsalar, masalan, choy krujkasi, cho'zilgan qo'lning masofasida yotadi. Va har doim ham kerak bo'lmagan narsalar joyida joylashgan. Va uni poligon yoki tartibsizlik deb atash mumkin emas.
Internetda ham o'z mantig'i bor. Agar siz bir nechta qoidalarni bilsangiz va ularni qidirishda foydalansangiz, Internetdan biron bir ma'lumot choy krujkasi, cho'zilgan qo'li va tarmoq axlatxonaning g'oyasini his qilish.
Boshlash uchun - qidiruv tizimi qurilmasining kichik lirli chekinishi. Shunday qilib, u foydalanuvchi tizimning o'zida, ya'ni qidiruv satri va tizim ichida bo'lgan barcha narsalar u erda qolayotganini ko'radi.
Qidiruv mexanizmi birinchi komponent - bu "o'rgimchak", qidiruv robotidir. Uning vazifalari nimada? U butun tarmoq bilan shug'ullanadi, Internet-sahifalarni ko'rib chiqadi, sahifalarni ko'rish, sahifalarni ko'rish. Va bularning hammasi to'xtashmaydi. O'rgimchakni o'zingizning zavqingiz uchun kiymang. U qidirilgan barcha sahifalar indeksiga kiradi. Ularni sahifada topilgan mazmunli so'zlar shaklida kiradi.
Shunday qilib, qidiruv tizimining ikkinchi tarkibiy qismi - bu ulkan ma'lumotlar bazasi bo'lib, ularda tarmoqda qaysi sahifalar mavjudligini tezda bilib olish imkoniyati mavjud. Ma'lumot uchun ma'lumot - Yandex qidiruv tizimiga ma'lum bo'lgan indeksning butun hajmi sakson gigabaytdan oshadi.
Indeksdan keyingi uchinchi komponent aslida qidiruv tizimidir. Uning tayinlanishi bu indeksdagi kerakli so'zlarni yoki iboralarni topishdir. Esingizda bo'lsa, qidiruv tizimi butun Internetni qidirmaydi - bu emas. Tasavvur qiling, bu haqiqatdir: masalan, Yandex-dagi indekslangan ma'lumotlarning to'liq miqdori 269 gigabayt. Agar sizning so'rovingizni kiritganingizdan so'ng indeks bo'lmasa, tizim 260 gigabayt ma'lumotlarini yuklab olishi va ko'rish kerak edi. Haqiqiy emas. Birgina so'rovni qayta ishlashda qancha vaqt o'tishi haqida o'ylang.
Qidiruv butun tarmoqda o'tkazilmaganligi sababli, lekin indeks bo'yicha ikkita xulosalar beriladi. Birinchidan, agar qidirish mexanizmi hech qanday ma'lumot topmasa, bu ma'lumotlar tarmoqda emas, balki bu qidiruv tizimi indeksda emas degani emas. Ikkinchidan, tarmoqdagi tarmoq qidirish tizimlari nafaqat interfeys, balki uni tayyorlashning indeksi va usullari ham bir-biridan farq qiladi. Shuning uchun, agar siz bitta qidiruv tizimida kerakli ma'lumotlarni topa olmasangiz, uni boshqasida qidirishingiz kerak.
Indeksni tashkil etadigan qidiruv roboti doiradagi barcha saytlarni chetlab o'tadi va muntazam ravishda - shuning uchun indeks har doim saytda yuz bergan o'zgarishlarni ko'rsatadi. Faqat "o'rgimchak" paydo bo'lishi mumkin bo'lgan saytlar o'z-o'zidan, boshqa saytlarning havolasiga urishadi. Shuningdek, sayt mualliflari o'zlarining "o'rgimchak" o'z veb-sayti haqida bilishlari mumkin.
Qidiruv mexanizmi oxirgi tarkibiy qismi - bu odamning odami bo'lgan butun dunyo bo'ylab veb-server. Bu foydalanuvchilarga so'rovlar va javob olishlari mumkin bo'lgan interfeys. World Wide Web-server - bu eng kattali emas, balki tizimning qismlaridan biri.
Qidiruv savollari tili
Qidiruv mexanizmlari bilan aloqa qilish uchun maxsus til va maxsus qoidalar mavjud. Albatta, to'liq javob sizning savolingizga darhol berilsa juda yaxshi bo'lar edi. Ammo endi ish faqat olib borilmoqda.
Avval siz kalit so'zlarni ta'kidlashingiz kerak. Qaysi so'zlarni qidirayotganingiz va bu so'zlarni tanishtirish bilan to'liq tavsiflanganligini hal qilish kerak. Siz ayonki, aniq. Ha bu shunday. Ammo siz qidiruv satriga ko'p odamlar kiritilganligini bilib olasiz.
Yandex-da, "to'g'ridan-to'g'ri to'g'ridan-to'g'ri" deb nomlangan yaxshi narsa bor. Bu sizning oxirgi 20 ta oxirgi ibora yoki so'zlarni ko'rishingiz mumkin bo'lgan sahifadir. Ushbu sahifani uzoqroq tomosha qiling va siz ko'p turli xil his-tuyg'ularni boshdan kechirasiz. Ba'zi so'rovlar alohida kitobga kiritilishi mumkin - ular juda ajoyib. Ba'zi so'rovlarga qarab, ishonchni qidirish shart emasligini tushunasiz.
Odatda, talablarning katta foizi aniq ravshanlik qilmaydi: "Video", "TV" "Yuklab olish" va boshqalarni. Talablar, tizimning o'zi foydalanuvchilarning xohish-irodasi deb taxmin qilishlari kerak deb o'ylashadi. Qidiruv so'rovini aniqlang va shunchalik aniqroq bo'ladi, keraksiz natijalar qidiruv tizimi chiqariladi.
Biroz qidiruv tizimlari Bir xil so'rovlar mavjud, ammo katta yoki kichik harfdan boshlab. Masalan, Yandex turli xil qidiruv natijalarini beradi va google tizimi Ro'yxatdan o'tmang.
Do'stlaringiz bilan baham: |