Обсуждены и интерпретированы основные вопросы компьютерной лингвистики



Download 53,48 Mb.
Pdf ko'rish
bet92/163
Sana26.07.2021
Hajmi53,48 Mb.
#128715
1   ...   88   89   90   91   92   93   94   95   ...   163
Bog'liq
Kompyuter lingvistikasi. A.Rahimov

«Informatsion  qidiruv»  (inglizcha  «information  retrieval»)  term ini  1948- 
yilda  K elvin  M u r to m o n id an   fanga kiritilgan.81  In fo rm atsio n   qidiruv tizimi
-  b u  m a ’lum otlarni qisqa vaqt birligi ichida qidirib topish, kerakli hu jjatlar­
ni  m a ’lu m o tlar bazasidan  topishni  optim allashtirish  tizim idir.  Bu y o ‘nalish 
ilm iy-texnikaviy  a x b o ro tlarn in g   k o 'p a y ib   ketishiga ja v o b a n   1960-yil  oxir- 
larida  yuzaga  keldi.  A x b o ro t  k o ‘paygan  sari  uni  saralash,  keraklisini  qidi­
rib topish m uam m osi yuzaga keldi. M azkur m uam m oni b a rta ra f etish uchun 
olim lar  inform atsion  qidiruv  tizim lari  g'oyasini  ta k lif etdilar.  Bu  yo'nalish 
In tern et  ta rm o g 'i yuzaga kelgandan  so ‘ng y an ad a  rivojlandi.  M asalan,  bu- 
gun  ham m aga m a ’lum ki,  In te rn e td a  Google, Yandex, Rambler, Yahoo  kabi 
qidiruv  tizim lari  m avjud.
Inform atsiyani  qidirish  quyidagi  4  bosqichni  o ‘z  ichiga  oladi:
-   in fo rm atsiy ag a  b o 'lg a n   ta la b n i  a n iq lash tirish   h a m d a   in fo rm atsio n  
s o ‘rovni  shakllantirish;
-   so 'ra lg a n   inform atsiya  saqlangan  m an b alarn i  (inform atsion  massiv- 
larni)  aniqlash;
81 
Manning C., Raghavan P., Schutze H. 
// Cambridge University Press.  2008. -  P.  5.


104
А . Rahimov
  info rm atsio n   m assivlardan  zaruriy  inform atsiyani  ajratib   olish;
-   inform atsiya  bilan  tanishish  va  q idiruv  natijalarini  baholash.
Q idiruvning  quyidagi  tu rlari  m avjud:
1.  T o i i q  m atnli qidiruv -  hujjatning t o ‘liq m azm un-m undarijasi asosida 
am alg a  o s h irila d ig a n   q id iru v .  M a sa la n ,  In te rn e td a g i  q id iru v   tizim lari:
2.  M e ta m a ’lu m o tlar  b o 'y ich a  qidiruv  -   hujjatning  m uayyan  atrib u tlari 
(hujjat  nom i,  y aratilg an   vfiqti,  hajm i,  m uallifi)  asosida  am alga  oshiriladi­
gan  qidiruv.  Q id iru v n in g   bu  tu rig a   M S  W indow s  tizim ida  fay llar  bilan 
ishlashda  foydalaniladigan  qidiruv  dialogi  m isol  b o 'la   oladi.
3.  T asvir  qidiruvi  -   tasvirning  m azm uni  asosida  am alga  oshiriladigan 
qidiruv.  B unda qidiruv tizimi rasm ning m azm unini taniydi va n atijad a shun- 
ga  o 'x sh a sh   rasm   topiladi.  Polar  Rose,  Picollator  q idiruv  tizim lari  m an a 
shu  tam oyil  asosida  ishlaydi.
4.  M u ltim ed iali  in fo rm atsiy a  qidiruvi  -   b u n d a   au d io   va  v ideofayllar 
b o 'y ich a  q idiruv  tushuniladi.
Q idirish  ja ra y o n i  turli  m eto d lar  asosida  yuz  beradi:  m anzilli  qidiruv, 
sem antik  q id iru v ,  h u jjatli  q idiruv,  fa k to g ra fik   qidiruv.  M anzilli  q id iru v  
so 'ro v d a   k o 'rsa tila d ig a n   so f  form al  belgilar  b o 'y ich a  h u jjatlarn i  qidirish 
jaray o n i  b o iib ,  b u n d a   hujjatning  aniq  m anzili  k o 'rsatilish i  lozim.  H u jjat­
ning  m anzili  w eb-server  va  w eb-sahifa  m anzili  yoki  bibliografik  q ayd  ele- 
m entlari  va  h u jjat  saq lan g an   jo y   sanaladi.  S em antik  qidiruv  hujjatlarlar- 
ning m azm uni  asosida qidirish  usuli  b o iib ,  b u n d a  hujjatning um um lashm a 
m azm uni,  sarlavhasi d esk rip to r k o 'rin ish id a  shakllantirilishi lozim.  H u jjat­
li  qidiruv  m atnli  m a ’lum otlar  h am d a  u lar  haqidagi  bibliografik  qaydlarni 
q id iris h   ja r a y o n id ir .  F a k to g r a f ik   q id iru v   s o 'r o v d a   n a z a r d a   tu tilg a n  
m a iu m o tg a   m os  keluvchi  fak tlarn i  (m atnli  hu jjatlar  ta rk ib id an   ajratilgan 
m a iu m o tla r)  q id irish   ja ra y o n id ir.  Y u q o rid a g ila rd a n   kelib  chiqib  ay tish  
m um kinki, q idiruv tizimi relatsion m a iu m o tla r  bazasida h am d a gipertekst- 
li  m a i u m o t l a r   b a z a s id a   m a v ju d   b o 'lg a n   h u jja tla r,  h u jja tla r  h a q id a g i 
m etam a’lu m o tlar,  m atn lar,  rasm lar,  video  va  audiofayllarni  qidirishni  o 'z  
ichiga  oladi.
In fo rm a tsiy a n in g   ek sp o n en sial  ta rz d a   k o 'p a y ib   k etay o tg an lig i,  shu- 
ningdek,  In tern et tizim ida ham  k u n d an  k u n g a m a iu m o tla r hajm ining o 'sib  
b o ra y o tg a n lig i  k o m p y u te r   lin g v is tik a s i  o ld ig a   b ir  q a t o r   v a z ifa la rn i 
k o 'n d a la n g  q o 'y m o q d a :
-   qidiruv  tizim ining  optim al  m odellarini  yaratish;
-   h u jjatlarni  tasniflash  (klassifikatorlar  tizim ini  yaratish);
-   hujjatlarni  klasterlash;


Kompyuter  lingvistikasi  asoslari
105
-   foydalanuvchi  interfeyslari  va  qidiruv  tizim lari  arx itek tu rasin i  loyi- 
halash;
-  zaruriy  inform atsiyani  ajratib  olish,  h u jjatlarni  av to m atik   referatlash 
va  annotatsiyalsh;
-  deskriptorli  tillar  va  tezauruslarni  m ukam m allashtirish,  boyitish.
Saqlangan  m a ’lum otning  ham da  qidirish  xususiyatiga  k o ‘ra  in fo rm at­
sion qidiruv tizim lari 2 k a tta  guruhga b o iin a d i:  hujjatli va faktografik IQ T. 
H ujjatli  IQ T lard a  m atn ,  tav sif  va  t a ’riflar  saq lan ad i,  faktografik  IQ T lar 
esa  ja d v a lla r,  form ulalar,  grafik  k o 'rin ish id a g i  m a ’lu m o tlarn i  o ‘z  ichiga 
oladi.  Shuningdek,  aralash  tabiatli  IQ T lar  ham   m avjud  b o 'lib ,  u n d a  ham  
hujjatli, ham  faktografik m a ’lum otlar saqlanadi. IQ T da qidiruvni ta ’m inlash 
uchun m axsus inform atsion qidiruv tillari mavjud. Inform atsion qidiruv tillari 
bu form al til  b o 'lib ,  u  IQ T da saqlangan h ujjatlarning m azm unini tavsiflash 
va so 'ro v  uchun m o'ljallangan. Inform atsion qidiruv tilida hujjatlarga ishlov 
berish p rotsedurasi indekslash deb ataladi.  Indekslash natijasida h a r bir huj- 
ja tg a   IQ T d ag i  t a ’rif  shakli  yoziladi.  M a z k u r  k o 'p   bosqichli  ja ra y o n d a  
deskriptorli  inform atsion  qidiruv  tillari  ishlatiladi.  H u jjat  m avzusi  deskrip- 
to rlarning  birlashuvi  bilan  yoziladi.  Deskriptorlar  sifatida  so 'zlar,  term in- 
lar,  m uayyan  sohadagi  b o sh lan g 'ich   tu sh u n ch a  va  k ateg o riy alard an   foy­
dalaniladi.  D eskriptorlarni kalit so 'zlar deb nom lash ham  m um kin. D eskrip­
torli  til  bilan  ishlaydigan  tizim lardan  biri  M .T aube  tom o n id an   yaratilgan 
U N IT E R M   tizim idir.  Bu  tizim d a  d e sk rip to rla r  sifatid a  h u jjatn in g   k alit 
so 'zlari -  un iterm lar ishlatiladi.  D em ak,  m uayyan  sohaning term inologiya- 
si, y a ’ni d esk rip to rlar qidiruv tizimi va tezauruslarning asosini tashkil etadi.
M atn n in g   asosiy  m azm un-m undarijasini  aks  ettirad ig an   kalit  so 'zlar, 
term inlar,  tayanch  tu sh u n ch alar  bazasi  asosida  k o m p y u terd a  lu g 'a t  tuzila- 
di.  B unday lu g 'a t  informatsion qidiruv  tezauruslari  deb  ataladi.  T ezauruslar 
ensiklopedik  va  izohli  lu g 'a tla rd a n   farqli  ravishda  til  birliklarining  m atnda 
q o 'llan ish   chastotasi  va  m atnning  predm et  m undarijasini  aks  ettirish  d ara- 
jasiga  q a ra b   tuziladi.  B unda  term inning  m azm uniy  tavsifi  orqali  bazadagi 
m a ’lu m o tlar qidirilishiga m o 'ljallangan b o 'lad i. T erm inlar tezaurusga q a t’iy 
sem antik prinsiplar asosida kiritiladi, b u n d a ularning gipo-geperonimik  (tur- 

Download 53,48 Mb.

Do'stlaringiz bilan baham:
1   ...   88   89   90   91   92   93   94   95   ...   163




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish