Коmpyuter lеksikografiyasiga oid tushuncha va terminlar - 1. Kompyuter leksikpgrafiyasi taraqqiyoti.
- 2. Kompyuter lug`atlari ning asosiy turlari.
- 3.Tezaurus lug`atlarining xususiyatlari.
-
Tayanch tushunchalar: kompyuter leksikografiyasi, kompyuter lug`atlari, tazaurus, ma’lumotlar bazasi, deskriptorlar Adabiyotlar: - 1. Шемакин Ю.И. Начало компьютерной лингвистики. –М.:Высшая школа, 1992.
- 2. Нелюбин Л.Л. Компьютерная лингвистика и машинный перевод.-М.: ВЦП, 1991.
- 3. Пулатов А.К. Тексты лекций по математической и компьютерной лингвистике (электронный вариант).
- 4. Абдураҳмонов Х., Рафиев А.,Шодмонқулова Д. Ўзбек тилининг амалий грамматикаси. –Т.: Ўқитувчи, 1992.
- 5.Пўлатов А., Муҳамедова С. Компьютер лингвистикаси (ўқув қўлланма). –Т., 2009.
- 6.Qurbonova F. Kompyuter lug`atlari: tezaurus.-T.,2013.
Tezaurus (thesauros) yunon tilidan olingan bo‘lib, g‘amlab qo‘yilgan narsa, «xazina» ma’nosini anglatgan holda ikki tomonlama tahlil qilinadi: – birinchisi lingvistik tahlil bo‘lib, unda to‘liq mazmunli axborotga ega bo‘lgan, tilga tegishli lug‘at hisoblansa; – ikkinchisida, ya’ni informatika yo‘nalishida esa inson yoki hisoblash mashinalariga uning ichida o‘zini erkin tutish imkonini beradigan, bilimlarning qaysidir bir sohasiga taalluqli tizimlashtirilgan axborotlar majmuyi sanaladi. Tezaurus «maxsus tashkil qilingan axborot», tildagi leksik birliklarning normaga keltirilgan holatdagi yig‘indisi, ya’ni lug‘atidir. Tezaurus, aslida, til semantikasini (milliy til, ma’lum fan tili yoki avtomatlashtirilgan boshqaruv tizimi uchun rasmiy qabul qilingan til) belgilaydi. Tezaurusning bir tilli lug‘atlardan ustunliklari mavjud, tezauruslarda har bir so‘z har tomonlama keng ochib beriladi. Bu lug‘atning elektron formatdagisi esa insonlarning vaqtini tejash, bir so‘z haqida to‘liqligicha ma’lumot olish imkonini beradi. Ruslarda yaratilgan tezaurus namunasi Tezauruslar so‘z ma’nolari o‘rtasidagi aloqalar, so‘zlarni birlashtirishiga qarab uch katta guruhga ajratiladi: - ideografik tezaurus;
- analogik tezaurus;
- assotsiativ tezaurus;
Tezauruslar turlarining ayrimlari quyidagilar: - Amara-kosha (Amara lug‘ati) muhim ahamiyatga ega bo‘lgan dastlabki sanskrit lug‘ati (III – IV asrlar).
- Tezaurus Roje (XIX asr), 15 000 ga yaqin leksik birlikni o‘z ichiga oladi.
- Vikislovar – ko‘p tilli, erkin to‘ldirilib boriluvchi lug‘at va tezaurus («Rusvikislovar»da 250000 tushuncha, 67000 munosabat mavjud).
- Ru Tez – тезаурус русского языка. Informatsion tadqiqotlar markazi tomonidan avtomatik indekslash maqsadida yaratilgan. 1997-yildan hozirga qadar 45000 tushuncha, 107000 so‘z va ifoda, 177000 munosabatni aks ettiradi.
Axborot qidiruvchi tildagi leksik birliklar «deskriptorlar» deyiladi. Deskriptor ma’lum bir soha matnlaridan ajratib olinadi va shu sohaga tegishli bo‘lgan, nutqda boshqa so‘zlarga nisbatan ko‘proq qo‘llaniladigan so‘zlar kalit so‘zlar sifatida tanlanadi. Masalan, deskriptor sifatida har qanday kalit so‘z yoki so‘z birikmasi, yoki sonli kod tanlanishi mumkin. Tezaurus tarkibidagi so‘zlar alfavit bo‘yicha emas, balki mavzu va mavzular majmui sifatida shakllangan lingvistik lug‘at hisoblanadi. Tezaurusning lug‘at tarkibidagi muhim vazifasi shuki, u so‘zlar va so‘z birikmalari o‘rtasidagi turli bog‘lanishlar (munosabatlar) haqidagi axborotlarni saqlashga xizmat qiluvchi ma’lumotlar bazasidir. Tezaurus lug‘at maqolasi quyidagi ko‘rinishda bo‘ladi: - GIPONIMI:
- bilag‘on,
- bilimli,
- topqir,
- o‘qimishli
- TUR – zakovat
- ko‘rsatkichi
- (yuqori
- darajada)
Do'stlaringiz bilan baham: |