Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti



Download 7,21 Mb.
Pdf ko'rish
bet88/398
Sana26.02.2022
Hajmi7,21 Mb.
#467559
1   ...   84   85   86   87   88   89   90   91   ...   398
Bog'liq
Тайёр Миллий корпус тўплам 17.05

Alisher Navoiy nomidagi Toshkent 
davlat o‘zbek tili va adabiyoti 
universiteti 
“O‘ZBEK MILLIY VA TA’LIMIY 
KORPUSLARINI YARATISHNING NAZARIY 
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021) 
73 
print(f'Found {words_found} words.')
Ba'zi holatlarda tarjima qilingan so'zlar o'zbek tili ma'lumotlar bazasidan topilmasligi mumkin. 
Bunday holatlarda so'zlarning izohini topish va misollar keltirish ham tilshunos mutaxassislarga 
zimmasiga yuklanadi. Barcha so'zlar to'liq izoh va misollarga ega bo'lgandan keyin so’zlarning leksik 
bog’lanishlarini saqlagan holda ularni sinsetlarga joylashtirib, XML formatdagi faylga quyidagi 
algoritmdan foydalanib yoziladi: 
def write_words_to_wordnet(self):
cnt = 0
words = []
with open('adj_words_uzb.txt', 'r') as f:
for line in f.readlines():
words.append(line)
definitions = []
with open('adj_definition_uzb.txt', 'r') as f:
for line in f.readlines():
definitions.append(line)
with open('../uzbek_adjective.xml', 'r') as f:
for line in f.readlines():
ind = line.find('')
ind2 = line.find('') + 5
ind3 = line.find('')
with open('wordnet_uzb .xml', 'a') as w:
w.write(line[0:48] + words[cnt].rstrip('\n') + line[ind:ind2] +
definitions[cnt].rstrip('\n') + line[ind3::])
cnt += 1
Hosil bo'lgan o'zbek tilidagi so'zlar joylashgan XML formatdagi fayl orqali barcha WordNet 
funksiyalarini bajarishimiz mumkin. 
WordNetni yuklash uchun, 
 
domain = WordNet("wordnet_uzb.xml"); 
Barcha sinsetlarni ko'rish uchun, 
 
synSetList(self) -> list
Ma'lum bir so'zning barcha ma'nolarini keltirish uchun quyidagilar ishlatiladi: 
getSynSetsWithLiteral(self, literal: str) -> list
Sinonim sinsetning sinonimik so'zlarni topish uchun quyidagi usul qo'llaniladi: 
Synonym getSynonym()
sinset ichidagi munosabatlarni indeksga asoslangan holda olish uchun quyidagi usul qo'llaniladi:
 
Relation getRelation(int index)
Masalan, sinsetdagi barcha munosabatlar, 
for (int i = 0; i < synset.relationSize(); i++){
 
 
relation = synset.getRelation(i);
 
 
... 
}
algoritmi orqali ko'rishimiz mumkin.
III. Xulosa. 
Ushbu maqolada WordNetning muhim qismlarini tezkor va avtomatik tarzda qurish yondashuvi 
keltirildi. O'zbek WordNetini yaratish uchun Turk WordNetdan asos sifatida foydalandik. So'zlarning 
mos tarjima va izohlari ma'lumotlar bazasiga mutaxassislar va turli xil leksik manbalardan (bir tilli va ikki 
tilli lug'atlar) tekshirilib ko'chirildi. Bizning yondashuvimizda O'zbek WordNetini qisqa vaqt ichida to'liq 
yaratish uchun bir qator vazifalar yechimlari taqdim etilgan. 



Download 7,21 Mb.

Do'stlaringiz bilan baham:
1   ...   84   85   86   87   88   89   90   91   ...   398




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish