Kompyuter lingvistikasi asoslari
105
- foydalanuvchi interfeyslari va qidiruv tizim lari arx itek tu rasin i loyi-
halash;
- zaruriy inform atsiyani ajratib olish, h u jjatlarni av to m atik referatlash
va annotatsiyalsh;
- deskriptorli tillar va tezauruslarni m ukam m allashtirish, boyitish.
Saqlangan m a ’lum otning ham da qidirish xususiyatiga k o ‘ra in fo rm at
sion qidiruv tizim lari 2 k a tta guruhga b o iin a d i: hujjatli va faktografik IQ T.
H ujjatli IQ T lard a m atn , tav sif va t a ’riflar saq lan ad i, faktografik IQ T lar
esa ja d v a lla r, form ulalar, grafik k o 'rin ish id a g i m a ’lu m o tlarn i o ‘z ichiga
oladi. Shuningdek, aralash tabiatli IQ T lar ham m avjud b o 'lib , u n d a ham
hujjatli, ham faktografik m a ’lum otlar saqlanadi. IQ T da qidiruvni ta ’m inlash
uchun m axsus inform atsion qidiruv tillari mavjud. Inform atsion qidiruv tillari
bu form al til b o 'lib , u IQ T da saqlangan h ujjatlarning m azm unini tavsiflash
va so 'ro v uchun m o'ljallangan. Inform atsion qidiruv tilida hujjatlarga ishlov
berish p rotsedurasi
indekslash deb ataladi. Indekslash natijasida h a r bir huj-
ja tg a IQ T d ag i t a ’rif shakli yoziladi. M a z k u r k o 'p bosqichli ja ra y o n d a
deskriptorli inform atsion qidiruv tillari ishlatiladi. H u jjat m avzusi deskrip-
to rlarning birlashuvi bilan yoziladi.
Deskriptorlar sifatida so 'zlar, term in-
lar, m uayyan sohadagi b o sh lan g 'ich tu sh u n ch a va k ateg o riy alard an foy
dalaniladi. D eskriptorlarni kalit so 'zlar deb nom lash ham m um kin. D eskrip
torli til bilan ishlaydigan tizim lardan biri M .T aube tom o n id an yaratilgan
U N IT E R M tizim idir. Bu tizim d a d e sk rip to rla r sifatid a h u jjatn in g k alit
so 'zlari - un iterm lar ishlatiladi. D em ak, m uayyan sohaning term inologiya-
si, y a ’ni d esk rip to rlar qidiruv tizimi va tezauruslarning asosini tashkil etadi.
M atn n in g asosiy m azm un-m undarijasini aks ettirad ig an kalit so 'zlar,
term inlar, tayanch tu sh u n ch alar bazasi asosida k o m p y u terd a lu g 'a t tuzila-
di. B unday lu g 'a t
informatsion qidiruv tezauruslari deb ataladi. T ezauruslar
ensiklopedik va izohli lu g 'a tla rd a n farqli ravishda til birliklarining m atnda
q o 'llan ish chastotasi va m atnning predm et m undarijasini aks ettirish d ara-
jasiga q a ra b tuziladi. B unda term inning m azm uniy tavsifi orqali bazadagi
m a ’lu m o tlar qidirilishiga m o 'ljallangan b o 'lad i. T erm inlar tezaurusga q a t’iy
sem antik prinsiplar asosida kiritiladi, b u n d a ularning
gipo-geperonimik (tur-
Do'stlaringiz bilan baham: