Omonimiya va lingvistik tizimlarda omonimlarni aniqlash usullari



Download 0,54 Mb.
Pdf ko'rish
bet5/6
Sana25.04.2022
Hajmi0,54 Mb.
#580415
1   2   3   4   5   6
Bog'liq
omonimiya-va-lingvistik-tizimlarda-omonimlarni-aniqlash-usullari

Qoidalarni qo‘lda 
kiritish usullari 
Qoidalarni 
avtomatik ishlab 
chiqish usullari 
Brill usuli 
Yashirin Markov modeli 
Modellar modefikatsiyasi 
Tayanch vektorlar usuli 
N-gramm modeli
Gibrid usul 


Oriental Renaissance: Innovative, 
educational, natural and social sciences 
 
VOLUME 1 | ISSUE 10 
ISSN 2181-1784 
Scientific Journal Impact Factor SJIF 2021: 5.423 
1020 
w
www.oriens.uz
November 
2021
 
Omonimlikni aniqlashning oddiy statistik metodi va boshqa shu kabi 
metodlarning tavsifini keltirish uchun quyidagi usullar ishlatiladi: 

w

– jumladagi i-o‘rinda joylashgan so‘z, 
t

– ushbu so‘zning identifikatori 
(tegi). 


(w)
 = {t
1
w
,t
2
w
,…,t
k
w
}
w so‘zining barcha mumkin bo‘lgan belgilar majmui. 
Ushbu ma’lumotlarni morfologik lug‘at yordamida olish mumkin. Agar so‘z lug‘atda 
bo‘lmasa uni Brill usulida bajarilganidek, ot so‘z turkumi sifatida hisoblash mumkin, 
ammo lingvistik ta’minot ishonchli bo‘lishi uchun barcha mumkin bo‘lgan teglarni 
qo‘yib chiqish kerak. 

C – korpusdagi muayyan holatlar soni (n-gramm). Bunda 
C(t)

 
t teglar soni; 
va 
C(t
1
,t
2
)
– bigrammalar soni 
(t
1
,t
2
)


C
t
(w,t)
– 

tegli 
w
so‘zlar soni. 

F(w,t)
– 

so‘zida 
t
tegi mavjudligi ehtimoli. Tavsiflar quyidagi formula 
bo‘yicha hisoblanadi: 
– 
P(t
i
|t
i–1
)
- bu 
t
i-1
tegidan keyin 
t
i
tegining kelish ehtimollik holati. Bunda 
i =

bo‘lganda 
t
i
tegi gapda birinchi teg hisoblanadi. Hisoblash formulasi quyidagicha: 
Yashirin Markov modeliga asoslanib, omonimlikni aniqlashning statistik metodi 
yordamida ishlash natijasida 
n
uzunlikdagi jumlada 
T
i
 

D(w
i

bo‘lganda 
T={T
1
,T
2
,...,T
n

teglarning ehtimoliy ketma-ketligi topiladi [7]. 
XULOSA 
Xulosa qilib aytganda, dunyo kompyuter lingvistikasida omonimlikni bartaraf 
etish usullari o‘rganilganida, bu xususdagi tajribadan foydalanib o‘zbekcha 
matnlardagi so‘zshakllarning tegishli tekshirish formulasi yaratildi. Omonimlikni 
bartaraf etish uchun har bir so‘zni “tasniflash” kerak, yaʼni uni lemma – gap bo‘lagi 
va morfologik xususiyatlar majmui bilan taqqoslash mumkin, ular qulaylik uchun bir 
tegga qo‘shiladi. Barcha mumkin bo‘lgan teglarni o‘rganish uchun morfologik 
lug‘atdagi so‘zlarga tegishli havolalarni topish yoki MyStem kabi morfologik 
analizatorni ishlatish yetarli bo‘lib, u so‘z teglarini topishda yordam beradi. Shundan 
so‘ng bir nechta teglar orasidan faqat tegishli tegni tanlash kerak bo‘ladi. 



Download 0,54 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish