1-rasm
Rus tilshunosligida tuzilgan tezaurus ko‗rinishi (1-2 rasm)
2-rasm
119
3-rasm. Diagramma holatida tuzilgan tezaurus
Tezaurus lug‗at xususiyatlarini quyidagicha umumlashtirish mumkin:
1) tezaurus lug‗atning avtomat ravishda tartibga solish, saqlash va
qidirish uchun ishlatiladigan tizimlarda qo‗llanadigan, ma‘lumotga oid
ko‗rinishi (ma‘lumot); tezaurus, raqamlash uchun tavsiya qilinadigan
so‗zlarni (deskriptorlarni), hujjat mazmunini ochib beruvchi muhim (kalit)
so‗zlarni o‗z ichiga oladi, shuningdek, ular orasidagi semantik
bog‗lanishlarni namoyon qiladi;
2) tezaurus tarkibidagi so‗zlar alfavit bo‗yicha emas, balki mavzu va
mavzular majmuyi shaklida keltiriladi; tezaurus bilimlarning qaysidir
sohasiga tegishli bo‗lgan so‗zlar tematik jihatlariga ko‗ra joylashtirilgan va
leksik birliklar o‗rtasidagi semantik munosabatlar ko‗rsatilgan lug‗at;
3) tezaurus leksik birliklarning matndagi qo‗llanishi misollar orqali
yoritilgan maksimal darajadagi to‗liq lug‗at ;
4) tezaurus – bu so‗zlar (lug‗aviy maqolalar) va so‗z birikmalari
(jumladan iborat maqolalar) o‗rtasidagi turli bog‗lanishlar (munosabatlar)
haqidagi axborotlarni saqlovchi ma‘lumotlar bazasidir.
Tezaurus lugatlarga oid asosiy tushunchalar tavsifi
Kompyuter lingvistikasida tezaurusning umumiy tavsifi, tezaurus
manbalarning tuzilishlari va mavjud atamalar o‗rtasidagi bog‗liqliklar
haqida ma‘lumot beriladi. Tezaurusga kiritish uchun atamalar tanlash
muammolari, shuningdek, bir qancha sinonimik atamalar orasidan asosiy
deskriptor-atamani tanlab olish masalalari ushbu mavzu ustida ko‗proq ish
olib BORIShni talab qiladi.
120
Tezaurusning elektron ko‗rinishi (versiyasi) amalga oshirilishining
o‗ziga xos xususiyatlaridan biri tasvirlashdir. Bunda asosiy e‘tibor
tezaurusda qo‗llanadigan atamalar haqidagi ma‘lumotlar tizimining
mantiqiy bir butunligini va undagi ma‘lumotlardan foydalanish qulayligini
ta‘minlashga qaratiladi. Hozirgi kunda, o‗z ichiga matnlardan axborotni
ajratib olish usullari haqidagi bilimlarni, hujjatlarni mazmuniga qarab
qidirish va indekslash, tilga oidlarini, jumladan nutqning rivojlanishi
haqidagi bilimlarni o‗z ichiga olgan ilmiy-amaliy fan sifatida kompyuter
lingvistikasiga bo‗lgan e‘tibor ortmoqda. Kompyuter lingvistikasi
atamalarini o‗zlashtirishga, ta‘lim samaradorligini oshirishga, shu sohaga
oid nashrlarni indekslashga, kompyuter lingvistikasi bo‗yicha bilimlardan
foydalanishni osonlashtirishga, soddaroq holatda avtomatlashtirilgan,
avtomatik ravishda ishlaydigan, tizimlashtirilgan bilimlarga katta ehtiyoj
sezilmoqda.
Kompyuter
lingvistikasi
–
o‗zbek
tilshunosligidagi
yangi
yo‗nalishlardan biridir. Hozirgi kunda o‗zbek tilshunosligida kompyuter
lingvistikasiga oid bir qator tadqiqotlar yuzaga kelmoqda. O‗z navbatida,
soha oldida turgan muammolar, hal qilinishi lozim bo‗lgan masalalar
anchagina. Shulardan biri kompyuter lingvistikasi atamalarini jamlash,
izohlash, kompyuter leksikografiyasini shakllantirish, o‗zbek tilidagi
kompyuter lug‗atlarini yaratish, ma‘lumotlar bazasi sifatida ahamiyatli
bo‗lgan tezauruslar tuzish bilan bog‗liqdir.
Zamonaviy kompyuter lingvistikasi atamalarining to‗liq ixcham
to‗plami nafaqat O‗zbekistonda, balki Rossiyada va hatto chet elda ham
mavjud emas. Aslida lingvistik terminlar ham bir necha asosiy
manbalarda, jumladan, ―Lingvistik ensiklopedik lug‗at‖da (LES),
O.S.Axmanova lug‗atida va tarkibida lingvistikaning yangi tushunchalari
bo‗lgan ―Kругосвет‖ internet-ensiklopediyasida aks ettirilgan. 2007- yilda
RFAda yaratilgan tilshunoslik tezaurusi ushbu fan bo‗limlariga tegishli
bo‗lgan 3000 ga yaqin atamani o‗z ichiga olgan. O‗zining barcha
afzalliklariga qaramasdan bu tezaurus, avvalambor bibliografik qidiruvga
mo‗ljallangan, shuning uchun lug‗aviy atamalar ta‘rifi (defenitsiyalari)ga
ega emas. Bundan tashqari, RFAda yaratilgan tezaurus bir tilli va aynan
kompyuter lingvistikasi atamalari ham keltirilgan (kompyuter lingvistikasi
sohasiga tegishli bo‗lgan umumiy atamalar tezaurusda keltirilgan atamalar
umumiy hajmining 4%iga teng).
Kompyuter lingvistikasi atamalari ta‘riflari Rossiyada nashr etilgan
―Sun‘iy intellekt‖ nomli lug‗atda ham mavjud. Biroq u 1980 yillar
oxiridagi
atamalarni
aks
ettiradi.
Bundan
tashqari,
kompyuter
121
lingvistikasiga oid atamalarning kam qismini qamrab oladi va unda
keltirilgan atamalar kompyuter lingvistikasi nuqtayi nazaridan emas, balki
sun‘iy intellekt nuqtayi nazaridan izohlangan.
Kompyuter lingvistikasi fanlararo bog‗lanishga ega bo‗lganligi sababli
shu sohaga oid terminlar izohini umumiy ensiklopedik lug‗atlar (masalan,
―Katta ensiklopedik lug‗at‖ –BES)da ham uchratish mumkin Hozirgi
kunda kompyuter lingvistikasi bilimlari bo‗yicha eng mashhur manba – bu
kompyuter lingvistikasi tushunchalarining ko‗p qismiga izohlar,
ko‗rsatmalar topish mumkin bo‗lgan ―Vikipediya‖dir, biroq bu
ma‘lumotlar ko‗pincha bir tomonlama, to‗liq emas va ularning ko‗pi
xomakidir.
Hozirgi kunda kompyuter lingvistikasining barcha terminlarini bir
tizimga birlashtirish uchun ingliz – rus yoki rus – o‗zbek tillaridagi
kompyuter lingvistikasiga oid terminlar izohini qamrab olgan ikki tilli
tezauruslar yaratish lozim bo‗ladi. Bunday tezaurus bilimlarning shu
sohasiga tegishli bo‗lgan terminlar to‗g‗risidagi ma‘lumotlarni to‗plash va
bir tizimga solish imkonini yaratadi, ma‘lumot manbalari, shu tizimdagi
axborotlarni mazmuniga qarab qidirish imkoni mavjud bo‗ladi. Bundan
tashqari, ushbu tezaurus nafaqat kompyuter lingvistikasi sohasining
bo‗lg‗usi mutaxassislarini, balki, umuman axborot texnologiyalari sohasi
mutaxassislari faoliyatini ham yengillashtirib, bilim darajalarining
oshirilishiga yordam beradi.
O‗zbek tilshunosligida tezauruslarning yaratilishida o‗zbek tili
xususiyatlarini hisobga olish lozim bo‗ladi. Har bir til birligiga oid
tushunchalar tezaurusini berishda ularning nutqdagi ahamiyatlilik
darajasidan kelib chiqib yondashiladi. Turkiy tillarda, jumladan o‗zbek
tilida fe‘llar fikr ifodalashda muhim o‗rin tutadi. Shu bois o‗zbek tilidagi
fe‘llar tezaurusini boshqa tillarga qiyoslagan holda yaratish tilning ijtimoiy
funksiyasini
oshirishda,
axborot
uslubini
shakllantirishda
va
takomillashtirishda muhim o‗rin tutadi.
Tezaurus tuzishda, dastavval, kompyuter lingvistikasi bo‗yicha
tezaurus yaratishga yondashuvlar o‗rganiladi. Tezaurusning umumiy
tuzilmasi, tezaurus manbalar strukturasi va terminlar orasidagi
bog‗liqliklar to‗plamini izohlash lozim bo‗ladi. Atamalar o‗rtasidagi
munosabatlarni tanlash va aks ettirishdagi muammolarga, shuningdek,
tezaurus terminologik tizimining mantiqiy bir butunligini ta‘minlashga
alohida e‘tibor qaratish kerak.
Tezaurusning mukammal variantini yaratishda Rossiya va Xalqaro
standartlar asosida tezaurusga kiritilishi mumkin bo‗lgan asosiy birliklarni
122
va ular o‗rtasidagi munosabatlar to‗plamini, leksik birliklar turlarini
yig‗ish qoidalarini o‗rnatish, so‗zlarni shakllantirish, so‗z manbalarini
tuzish va axborot-qidiruv tezauruslarini rasmiylashtirish lozim.
Tezaurusning asosiy atamalari fanda
Do'stlaringiz bilan baham: |