D. B. O‘rinbayeva


-MAVZU: INFORMATSION QIDIRUV TIZIMI



Download 0,93 Mb.
Pdf ko'rish
bet49/63
Sana17.07.2022
Hajmi0,93 Mb.
#811476
1   ...   45   46   47   48   49   50   51   52   ...   63
Bog'liq
KOMPYUTER LINGVISTIKASIDAN UNIVERSAL QO‘LLANMA

 
11-MAVZU: INFORMATSION QIDIRUV TIZIMI. 
GIPERTEKST TEXNOLOGIYASI. 
 
 
Kompyuter lingvistikasining yana bir yo‘nalishi information qidiruv tizimi 
hisoblanadi. Ular axborotlarni qidirishga mo‘ljallangan. U quyidagi bosqichlarda 
ishlaydi: 
-
informatsiya (axborot)ni jamlash; 
-
informatsiya (axborot)ni tasniflash; 
-
hujjatni qidiruv obrazini yaratish; 
-
hujjatni qidiruv obrazi va hujjanrlarni saqlash; 
-
qidirish va natijani chiqarish. 
Informatsiyon qidiruv (inglizcha information retrieval) atamasi 1948-yil Kelvin 
Mur tomonidan birinchi marta fanga kiritilgan.
Axborot-izlanish sistemasi 
– 1950-1960 yillarda ilmiy-texnik axborotlar keskin 
sur’atda oshdi. Millionga yaqin ixtirolar va turli ko‘rinishdagi bir necha million ilmiy 
yangiliklar mavjud bo‘lib, ular muntazam ravishda ko‘pgina tillarda berib boriladi. 
Millionlab ilmiy-texnika jurnallari nashr qilinib, ularda maqolalar chop etilmoqda. 
Har qanday ilmiy-texnik axborotni keng kitobxonlar ommasiga o‘z vaqtida va oson 
yetkazishning birdan-bir yo‘li – matnlarni turli tillarga tarjima va annotatsiya 
qiladigan dasturlarni yaratishdir. Shunday sharoitda kompyuter lingvistikasi 
axborotlarni saqlaydigan va qayta ishlov beradigan axborot – izlanish (AIS) sistemasi 
ishlab chiqdi.
AIS o‘zining xususiyatiga ko‘ra ikki xil bo‘ladi: hujjatiy va faktografik. 


61 
Hujjatiy AISda hujjat matnlari saqlanadi. Masalan: referatlar, bibliografik 
kartochkalar va boshqalar. 
Faktografik AISda aniq daliliy ashyolar saqlanadi. Masalan, jadvallar, 
formulalar, turli suratlar va boshqalar. 
Hozirgi kunda ham hujjatiy, ham faktografik AIS birgalikda ma’lumotlar 
bazasida (MB) saqlanadi. AISni ishlash jarayonida maxsus til qo‘llaniladi. Bu til 
indeksatsiya yoki indekslash deyiladi. Birinchi marta amerikalik olim M.Taube AIS 
uchun UNITERM nomli maxsus deskriptor til yaratgan. UNITERMda deskriptorlar 
sifatida hujjatning kalit so‘zlari – unitermlar ishlatiladi. Hozirgi kunda ushbu tildan 
takomillashtirilgan holda foydalanilmoqda. 
Matnning asosiy mazmun-mundarijasini aks ettiradigan kalit so‘zlar, tayanch 
tushunchalar, atamalar bazasi asosida kompyuterda lug‘at tuziladi. Bunday lug‘at 
information qidiruv tezaurusi deb ataladi. 
Tezauruslar ensiklopedik va izohli lug‘atlardan farqli ravishda til birliklarining 
matnda qo‘llanish chastotasi va matnning predmet mundarijasini aks ettirish 
darajasiga qarab tuziladi. Bunday tezauruslar matnni tezkor tanlab olish va topish 
imkonini beradi.
MBsidagi axborotlar olimlarimiz tomonidan yaratilgan mashina lisoniy-axborot 
ta’minoti bilan to‘ldiriladi. Ishlangan lisoniy algoritmlar, modullar bir sistemaga 
jamlanishi lozim. Sistemaga jamlangan lisoniy-axborot, kompyuter-axborot 
ta’minoti, ma’lumotlar bazasi (bank) ma’lum bir matnni avtomatik qayta ishlash 
mexanizmini yaratadi. Mexanizmni ishlash jarayonida har bir soha mutaxassisi 
o‘zining axborotlari bazasi bilan ta’minlaydi. 
Ma’lumotlar bazasining kengayishi bilan lisoniy-axborot ta’minoti muammosi 
kamayadi. Lisoniy ma’lumotlar banki umumiy tizimda blok-sxemada o‘z ifodasini 
topadi, ya’ni tilning mashina fondi (TMF) yaratiladi. Amaliy ishlarda TMF zarur 
bo‘lib, unda til tizimining modellari, tizim sifatida aniq bir uslubning (funktsional 
uslublari, hozirgi va qadimgi adabiy til) barcha til birliklari, nutqdagi til birliklarining 
qo‘llanish qonuniyatlari, nutq birliklarining yuzaga kelish qoidalari to‘liq o‘z 
ifodasini topmog‘i lozim. 
Bu yo‘nalish INTERNET yuzaga kelgandan so‘ng yanada rivojlandi. Masalan, 
Internetda Google, Yandex, Rambler, Yaho kabi qidiruv tizimlari ishlamoqda. 
Axborotni qidirish 4 bosqichni o‘z ichiga oladi: 
-
axborotga bo‘lgan talabni aniqlashtirish hamda informatsiyon so‘rovni 
shakllantirish; 
-
so‘ralgan axborotni saqlagan manbalarni aniqlash; 
-
axborot massivlaridan zarur axborotni ajratib olish; 
-
axborot bilan tanishish va qidiruv natijalarini baholash. 

Download 0,93 Mb.

Do'stlaringiz bilan baham:
1   ...   45   46   47   48   49   50   51   52   ...   63




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish