Tezaurusni tuzish. Tezauri



Download 38,4 Kb.
bet1/2
Sana14.04.2022
Hajmi38,4 Kb.
#552623
  1   2
Bog'liq
7- мавзу


TEZAURUSNI TUZISH. TEZAURI
Ostida tezaurus lug'at tarkibidagi barcha ma'nolar semantik munosabatlar bilan o'zaro bog'liq bo'lib, tushuntirilgan bilim sohasidagi tushunchalarning asosiy munosabatlarini aks ettiradigan so'z birikmasi tarkibiy qismi tushuniladi. Ilgari, tezaurus atamasi avvalo lug'atlarga ishora qilar edi, ularning maksimal to'liqligi tilning lug'aviy tarkibini matnlarda ishlatish misollari bilan ifodalaydi.
Tezaurus o'z ichiga oladi tokenlarnutqning to'rtta qismi bilan bog'liq: sifatlar, ot, fe'l va kelishik. Nutqning har bir qismiga mos keladigan tavsiflar boshqa tuzilishga ega.
Tezaurusdagi asosiy aloqalar:

  • sinonimiya - tovush va imlo jihatidan farq qiladigan, lekin bir xil yoki juda yaqin leksik ma'noga ega bo'lgan nutqning bir qismidagi so'zlarning o'zaro bog'liqligi, masalan: otliq - otliq, jasur - jasur;

  • antonimiya - to'g'ridan-to'g'ri qarama-qarshi ma'nolarga ega bo'lgan, ovozli ravishda farq qiladigan nutqning bir qismidagi so'zlar o'rtasidagi munosabatlar: haqiqat yolg'on, yaxshilik yomon;

  • giponimiya / giperonimiya. Giperonim - umumiy, umumiy tushunchani, ob'ektlar (xususiyatlar, atributlar) sinfining (to'plamining) nomini anglatadigan kengroq ma'noga ega so'z. Giponim - ob'ektni (mulk, atribut) sinfning (to'plamning) elementi deb ataydigan tor ma'noga ega so'z. Ushbu munosabatlar o'tish va assimetrikdir. Giponim giperonimiyaning barcha xususiyatlarini meros qilib oladi. Ular otlarni tasvirlashda markaziy munosabatlardir;

  • meronimiya / Partonimiya - "UMUMIY HISOBOT" munosabati Ushbu munosabatlar doirasida "element" va "qilingan" munosabatlar alohida ajralib turadi. Aloqa faqat otlar uchun belgilanadi;

  • natija (bu munosabatlar fe'llarni bog'laydi);

  • sabab (fe'llar uchun ham aniqlanadi).

Tezaurusga misol:
Izba - yog'och dehqon uyi [giperonim]: turar-joy binosi [merononim]: qishloq aholi punkti [sinonimi]: uy
Barcha munosabatlar murakkab kontseptsiyalarning ierarxik tarmog'ini yaratadi va ushbu tarmoqdagi kontseptsiyaning qaerdaligini bilish ushbu tushuncha haqida bilishning muhim qismidir. Aloqaning xususiyatlari nutqning turli qismlarini tavsiflashda farq qiladi.
Turli xil tizimlarda tezaurus turli xil funktsiyalarni bajarishi mumkin:

  • tor yoki keng mavzu sohasidagi maxsus bilimlar manbai, fan sohasidagi atamalarni tavsiflash va soddalashtirish usuli;

  • axborot izlash tizimlarida izlash vositasi;

  • axborot olish tizimlarida hujjatlarni qo'lda indeksatsiya qilish vositasi (boshqarish lug'ati deb ataladi);

  • avtomatik matnni indekslash vositasi.

Tezisur konseptual lug'atlar sifatida ingliz lug'atini guruhlarga ajratgan Roger (yoki ingliz fizigi Roget) bilan boshlandi. Har bir guruh kontseptsiya nomi bilan ifodalanadi (birinchi bo'lib mingtadan iborat bo'lgan "toifalar"; bu alifbo tartibidagi oddiy so'zlar, masalan AFFIRMATION ... AGENCY ...), so'ngra uning nutq qismlari uchun sinonimlari (ot, fe'l, sifatlar, lug'at maqolasida "uzoq qarindoshlar" ro'yxati o'tishi mumkin bo'lgan lug'at maqolasida, masalan, AGENCY dan ... BIZNESga qarang. 1852 yilda Rojer tezaurusi nashr etilganidan beri va hanuzgacha u har xil shakllarda va turli foydalanuvchilar uchun qayta nashr etilmoqda, tezaurus doimiy ravishda yangi so'z birikmalari va ulanishlar bilan yangilanadi, ammo barcha variantlarning orqasida birinchi versiyani yaratuvchisining ismi turadi. Ushbu tezisning tabiiyligidagi ahamiyati shundaki, bu nafaqat tilning butun lug'atining tavsifi, nafaqat atamalar, balki tizimning semantik kuchini oshirish vositasi sifatida ma'lumot olish tizimlaridan foydalanishda ishtirok etilishi mumkin.
Tezauri hanuzgacha insonning idrokiga mos keladigan fan sohasidagi bilimlarni tavsiflashning eng ko'p qabul qilingan shakli bo'lib qolmoqda. Zamonaviy xorijiy tezislarning namunalari WordNet va EuroWordNet.
WordNet English tezaurusi 1990 yilda paydo bo'lgan. so'zlarni avtomatik qayta ishlashning turli sohalarida faol ishtirok eta boshladi. WordNet 100 mingga yaqin turli xil birliklarni qamrab oladi (ularning deyarli yarmi iboralar), ular 70 000 ta kontseptsiyada tashkil etilgan.
Hozirda ko'p tilli EuroWordNet tezaurusi ishlab chiqilmoqda. Dastlab, to'rtta til (Daniya, Italiya, Ispaniya va Amerikalik ingliz) uchun semantik munosabatlar bilan bog'langan va bir-biriga turli xil tillarda so'zlarni topishga imkon beradigan so'zlar tarmog'i yaratilmoqda. Ingliz tilining leksik va kontseptual tizimini tavsiflash uchun yaratilgan Roger tezaurusi va WordNet-dan farqli o'laroq, EuroWordNet birinchi navbatda katta hajmdagi matnlarni avtomatik qayta ishlashning amaliy muammolarini hal qilish uchun yaratilgan. Ushbu tezis yordamida hal qilinishi kerak bo'lgan eng muhim vazifalar quyidagilar:

  • ko'p tilli ma'lumot olish;

  • ma'lumotlarni olishning to'liqligini oshirish;

  • so'rovni tabiiy tilda shakllantirish;

  • hujjatlarni semantik indeksatsiya qilish va boshqalar.

Ushbu aloqalarga qo'shimcha ravishda, bitta mavzu sohasi tushunchalarini bir-biriga bog'laydigan tematik aloqalar ham joriy etiladi. Shuningdek, kontseptsiyalar o'rtasidagi munosabatlarning nomutanosibligini yoki o'zaro bog'liqligini ko'rsatadigan maxsus yozuvlarni kiritish maqsad qilingan. Agar tarmoqdagi ma'lum bir kontseptsiyada bir xil nomdagi bir nechta munosabatlar mavjud bo'lsa, demak ular disjunktiv bo'lishi mumkin, ya'ni bu munosabatlardan biri aslida amalga oshirilgan yoki kon'yunktiv, ya'ni bu munosabatlarning barchasi kontseptsiya uchun amal qiladi.
Ushbu institut lug'atlarining ma'lum bir davlat standartiga mos keladigan yuzdan ortiq filial tezislari mahalliy institutlarda yaratilgan. Ular shunday deb nomlangan - IPT - ma'lumotlarni qidirish tezaurusi. Kontseptsiyalar o'rtasidagi barcha mumkin bo'lgan semantik munosabatlarning uchida ular o'rnatilgan: sinonimik, umumiy (odatda "WHO-PART" munosabati nazarda tutiladi) va "barcha boshqalar", shuningdek assotsiativ deb ham ataladi.
Standart IPTlar asosan hujjatlarni qo'lda indeksatsiyalash, shuningdek qidirish jarayonida so'rovlarni shakllantirish va o'zgartirish uchun mo'ljallangan. Nomoddiy tezauruslar mavjud bo'lib, ular ma'lum bir bilim sohasidagi terminologiyani tanlab tizimlashtirish vazifasini yuklaydi - bu ayniqsa yangi fan sohalariga tegishli. Tez atamalarni atamalar ta'riflari bilan boyitish tendentsiyasi tobora ortib bormoqda, bu atamalarning noaniqligini farqlash uchun muhimdir, ayniqsa aloqador fanlar holatida va tor mavzular doirasidan chiqib ketishda.
O'RNAK
Sin: model, misol, misol, sinov, standart, norma, o'lchov, namuna, standart, odatiy vakil, shablon, stencil, prototip, chizma, dizayn, chizma, naqsh, gestalt, ramka.
Rus tilining tezaurusi. 2012

Download 38,4 Kb.

Do'stlaringiz bilan baham:
  1   2




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish