WORLD WIDE WEB MUAMMOLARI
Butunjahon Internet tarmog'ining paydo bo'lishi Internetni eng muhim va eng katta ma'lumot manbalaridan biriga aylantirdi, ammo muammo Internetning taqsimlanganligi edi, bu esa Internetni qamrab oluvchi turli xil materiallar massasi orasida to'g'ri ma'lumotni topishni juda qiyinlashtirdi. inson faoliyatining eng xilma-xil sohalari. Shu sababli, deyarli Internet paydo bo'lganidan beri qidiruv tizimlari deb ataladigan tizimlar ishlab chiqilgan va ishga tushirilgan. WWW paydo bo'lishidan oldin ular birinchi navbatda foydalanuvchilar fayl almashishlari mumkin bo'lgan FTP serverlari tarmog'i tarkibini indekslashdi va qidirdilar, ammo HTML paydo bo'lishi bilan ular tezda Web-saytlarga o'tishdi. WWW kengayishi bilan qidiruv tizimlarining ishi tobora murakkablashdi: etarli qamrovni ta'minlash uchun ular tobora ortib borayotgan ma'lumotlarni indekslashlari va qayta ishlashlari kerak edi. Ammo asosiy qiyinchilik hatto indekslangan saytlar sonini ko'paytirishda emas, balki foydalanuvchilarning qidiruv so'rovlariga tegishli javoblarni taqdim etishda, ya'ni foydalanuvchilarga ularning fikricha, ular izlayotgan narsaga mos keladigan manbalarga havolalar berishda edi.
Dastlabki kontseptsiyasiga muvofiq, WWW og'ir ishtirokchi muhit edi. Vaqt o'tishi bilan veb-kontentni turli xil robotlar, xususan, qidiruv tizimlarining indekslash modullari tomonidan qayta ishlash zarurati paydo bo'lganda, dasturlar ma'lumotni inson kabi sharhlay olmasligi aniq bo'ldi. Albatta, sun'iy intellekt sohasida ba'zi yutuqlarga erishildi, biroq amalda ularning aksariyatini qidiruv tizimlarida amalga oshirishning iloji yo'qligi ma'lum bo'ldi. Shunday qilib, qidiruv tizimlari, masalan, maqola sahifasida matnning qolgan qismidan ko'ra ko'proq ahamiyat berilishi kerak bo'lgan sarlavha borligi va sayt navigatsiyasi qayerda joylashganligi haqida taxmin qilishlari mumkin edi. umuman indekslangan. Va agar sayt ichida, masalan, ma'lumotlar bazasida, ma'lumotlar tuzilgan shaklda saqlangan bo'lsa ham, u allaqachon matnli ma'lumot sifatida berilgan, shu bilan birga turli xil ma'lumotlar elementlari o'rtasidagi munosabatlar haqidagi ma'lumotlarning muhim qismi yo'qolgan. Qidiruv mexanizmlari qidiruv sifatini tegishli darajada ushlab turish uchun bir qator usullardan foydalanadi, agar foydalanuvchi, qoida tariqasida, agar u juda ko'p harakat qilsa, hali ham izlayotgan narsasini topa oladi.
Asosan, bu usullar qidiruv natijalarini saralash va yangi yoki o'zgaruvchan sahifalarni indekslashni tezlashtirish bilan bog'liq. Ular orasida resurslarning vakolatlarini trafik ma'lumotlaridan foydalanishni va maxsus hisoblagichlardan foydalangan holda yangi sahifalar haqida ma'lumotni, mavzuli kataloglardan saytlar haqida ma'lumot olishni aniqlaydigan turli xil algoritmlar mavjud. mavzu resursini aniq aniqlash uchun. Ammo, bu barcha choralarga qaramay, ko'plab foydalanuvchilar zamonaviy qidiruv tizimlarining ishi bilan qoniqish hosil qilmaydi.
Semantik tarmoq hozirgi vaziyatni - WWW ning navbatdagi evolyutsion bosqichini to'g'irlashi kerak, bunda Internetda chop etilgan barcha ma'lumotlar, albatta, metadata, ya'ni u yoki buning ma'nosi va maqsadini tushunishga imkon beradigan ma'lumotlar to'g'risidagi ma'lumotlarni o'z ichiga olishi kerak. axborot, shuningdek, uning alohida komponentlari o'rtasidagi munosabatlar. Oddiy qilib aytganda, semantika ma'noni anglatadi.
Do'stlaringiz bilan baham: |