Foydalanuvchi



Download 47,99 Kb.
bet1/8
Sana29.05.2022
Hajmi47,99 Kb.
#614458
  1   2   3   4   5   6   7   8
Bog'liq
AnnotatedCorpusConstruction uzbek tilida (1)




Ushbu sahifadan keyingi barcha kontent Mohammed Almashraee tomonidan yuklangan 2016 yil 09-noyabr.


Foydalanuvchi yuklab olingan faylni yaxshilashni so'radi.

1


Izohlangan korpus qurilishi
Lars Vissler, Muhammad Almashrayi, Dagmar Monett va Adrian Pashke
Xulosa - Ushbu maqola tabiiy tilni qayta ishlash va hissiyotlarni tahlil qilish kontekstida izohli korpus qurilishiga kirishni ta'minlashga qaratilgan. U odatda sintaktik, semantik va leksik teglashni tushuntiradi, avtomatik va qo'lda qurish yondashuvlarini taqqoslaydi va bu sohadagi so'nggi yutuqlar natijalarini ko'rsatadi. Shuningdek, taniqli ilovalar va izohli korpusdan foydalanishda yuzaga kelishi mumkin bo'lgan muammolar haqida umumiy ma'lumot berilgan.


ÿ

1.KIRISH


Annotatsiya - hujjatlarni, jumlalarni yoki so'zlarni oldindan belgilangan toifalar to'plamidan tanlash bilan belgilashni anglatadi. Ob'ektlar yoki grammatik tuzilmalar kabi qiziqarli
elementlar aniqlanadi va shu bilan matnli ma'lumotlar qo'shimcha tuzilgan ma'lumotlar bilan boyitiladi. Asosan,
izohlovchi matnning o'zboshimchalik bilan, ammo aniq belgilangan kichik to'plamini joriy kontekstdagi ma'nosi bilan belgilaydi. Qaysi ma'lumotlar qo'shilishi izohlarning maqsadiga bog'liq bo'lib, leksik ma'lumotlarga nisbatan sintaktik ma'lumotlardan semantik assotsiatsiyalargacha bo'lishi mumkin. Korpusni belgilash jarayoni odatda dastlabki ishlov berish bosqichidan boshlanadi, matnni formatlash, ya'ni to'xtash so'zlarini olib tashlash va stemming.
Ikkinchi bosqichda mavjud ma'lumotlar (odatda atamalar yoki atamalar konstruktsiyalari) toifalarga bo'linadi. Keyin yangi tasniflangan ma'lumotlar tuzilgan shaklda taqdim etiladi.

Izohlardan foydalanadigan ilovalar avtomatik ravishda maqolalarning xulosalarini yaratadi, qo'shimcha bilimlardan


foydalanadi, masalan, kuchli semantik qidiruv tizimlarida [1]
yoki rasmiy ontologiya modelidan [2] foydalanib, fond bozoridagi tendentsiyalarni ajratib oladi.
Izohlangan korpus ko'pincha katta ma'lumotlar to'plamlarini avtomatik ravishda qayta ishlashga imkon beruvchi tasniflagichlarni yaratish uchun ishlatiladi. Shu nuqtai nazardan,

o'rgatish kerak bo'lgan xususiyatlar to'plami va shuning uchun


teglar to'plami izohlashdan oldin yaxshi aniqlangan bo'lishi kerak.



Download 47,99 Kb.

Do'stlaringiz bilan baham:
  1   2   3   4   5   6   7   8




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish