Avtomatlashtirilgan ma'lumot olish tizimi (IPS) - ma'lumotni, odatda matnli hujjatlarni qidirish uchun mo'ljallangan dastur.
IPS funktsiyalarini bajaradigan turli xil vositalar chaqiriladi qo'llab-quvvatlovchi quyi tizimlaryoki "garov". Quyidagi quyi tizimlar ajralib turadi: lingvistik qo'llab-quvvatlash, axborot bilan ta'minlash, texnik qo'llab-quvvatlash, dasturiy ta'minot, texnologik qo'llab-quvvatlash, xodimlar bilan ta'minlash va boshqalar.
Qidiruv tizimidagi so'rovlar tuzilgan til deyiladi ma'lumot qidirish yoki qidiruv so'rovlari tili. Axborot olish tili rasmiylashtirilgan sun'iy tildir. Odatda lug'at (tezaurus) va har xil murakkablikdagi grammatikadan, shuningdek, mantiqiy operatorlardan, til morfologiyasidan, so'z registridan, so'zlar va kengaytirilgan qidiruv o'rtasidagi masofani hisobga olish qobiliyatidan iborat.
Turli xil IPNlarning yaratilishi, ma'lumot olish uchun tabiiy tilning "ko'payishi" va "etishmovchiligi" ni, shuningdek, unda mavjud bo'lgan sinonim va homonimlarni yo'q qilish zarurati bilan bog'liq.
PI qidiruv strategiyasini yoki maqbul natijalarga erishish yo'llarini belgilaydigan muayyan qoidalarga muvofiq amalga oshiriladi.
Axborot izlash bosqichlari:
1. Axborotga bo'lgan ehtiyojni aniqlashtirish va so'rovni tahrirlash.
2. Foydalanuvchi so'roviga mos keladigan ma'lumot manbalarini tanlash.
3. Axborot massivlaridan ma'lumot olish
4. Qidiruv natijalarini baholash.
Axborotga bo'lgan ehtiyojni aniqlashtirish.
Axborotga ehtiyoj - bu foydalanuvchi haqida ko'proq bilishni istagan mavzu. Bu so'rovdan farq qilishi kerak, ya'ni. chunki foydalanuvchi qidirish satriga kirishi kerak. Axborotga bo'lgan ehtiyoj IPS «tushunadi» degan ma'noni anglatadi.
Ko'pincha, qidiruvni amalga oshiradigan odam, uni qiziqtirgan mavzular haqida eng taxminiy fikrga ega yoki u yozmoqchi bo'lgan hujjatni qidirmoqda. Odatda foydalanuvchi ma'lum, oldindan ma'lum bo'lgan hujjatni emas, balki muammoni hal qilish uchun zarur bo'lgan ba'zi ma'lumotlarni (dalillarni) topishi kerak.
Mavzu bo'yicha so'rovning matni kalit so'zlar yoki iboralar shaklida chegaralangan bo'lishi kerak. Kalit so'zlar - bu hujjatning asosiy mavzusini aks ettiradigan va axborotga bo'lgan ehtiyojni tavsiflovchi so'zlar yoki iboralar to'plami.
Qidiruvning aniqligi va to'liqligi nafaqat IPSning o'ziga xos xususiyatlariga, balki so'rov qanday yaratilishiga ham bog'liq. Zamonaviy tizimlarda hali sun'iy mavjud emas
razvedka va aniqlashtiradigan savollarni berishga qodir emas, shuning uchun sizning ma'lumotga bo'lgan ehtiyojingizni qondiradigan javobni faqat aniq shakllangan so'rovga erishish mumkin, ammo har doim ham foydalanuvchi uni kerakli natijaga olib keladigan kalit so'zlarning aniq to'plamini aniq va aniq belgilab bera oladi. Asosiy muammolar kalit so'zlarni muvaffaqiyatsiz tanlash va so'rov natijalari ro'yxatida olingan keraksiz hujjatlarni ko'rish bilan bog'liq.
Va shuning uchun, agar iloji bo'lsa, bir nechta so'zlar, ularning kombinatsiyalari va ba'zan aniq iboralar uchun qidiruvni amalga oshirish yaxshiroqdir. Barcha rasmiy so'zlar (predloglar, birikmalar, zarralar va boshqalar) asosiy deb hisoblanmasligi kerak, yuzaga kelish chastotasi kichik bo'lgan atamalar qidiruvga kiritilmasligi kerak, tez-tez uchraydigan (Moskva) - ularning ma'nosini toraytirish uchun boshqa so'zlar bilan birgalikda ishlatilishi kerak.
Do'stlaringiz bilan baham: |