Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti “O‘ZBEK MILLIY VA TA’LIMIY KORPUSLARINI YARATISHNING NAZARIY HAMDA AMALIY MASALALARI” Xalqaro ilmiy-amaliy konferensiya
Vol. 1 №. 01 (2021) 73
print(f'Found {words_found} words.') Ba'zi holatlarda tarjima qilingan so'zlar o'zbek tili ma'lumotlar bazasidan topilmasligi mumkin.
Bunday holatlarda so'zlarning izohini topish va misollar keltirish ham tilshunos mutaxassislarga
zimmasiga yuklanadi. Barcha so'zlar to'liq izoh va misollarga ega bo'lgandan keyin so’zlarning leksik
bog’lanishlarini saqlagan holda ularni sinsetlarga joylashtirib, XML formatdagi faylga quyidagi
algoritmdan foydalanib yoziladi:
def write_words_to_wordnet(self): cnt = 0 words = [] with open('adj_words_uzb.txt', 'r') as f: for line in f.readlines(): words.append(line) definitions = [] with open('adj_definition_uzb.txt', 'r') as f: for line in f.readlines(): definitions.append(line) with open('../uzbek_adjective.xml', 'r') as f: for line in f.readlines(): ind = line.find('') ind2 = line.find('') + 5 ind3 = line.find('') with open('wordnet_uzb .xml', 'a') as w: w.write(line[0:48] + words[cnt].rstrip('\n') + line[ind:ind2] + definitions[cnt].rstrip('\n') + line[ind3::]) cnt += 1 Hosil bo'lgan o'zbek tilidagi so'zlar joylashgan XML formatdagi fayl orqali barcha WordNet
funksiyalarini bajarishimiz mumkin.
WordNetni yuklash uchun,
domain = WordNet("wordnet_uzb.xml"); Barcha sinsetlarni ko'rish uchun,
synSetList(self) -> list Ma'lum bir so'zning barcha ma'nolarini keltirish uchun quyidagilar ishlatiladi:
getSynSetsWithLiteral(self, literal: str) -> list Sinonim sinsetning sinonimik so'zlarni topish uchun quyidagi usul qo'llaniladi:
Synonym getSynonym() sinset ichidagi munosabatlarni indeksga asoslangan holda olish uchun quyidagi usul qo'llaniladi:
Relation getRelation(int index) Masalan, sinsetdagi barcha munosabatlar,
for (int i = 0; i < synset.relationSize(); i++){ relation = synset.getRelation(i); ... } algoritmi orqali ko'rishimiz mumkin. III. Xulosa. Ushbu maqolada WordNetning muhim qismlarini tezkor va avtomatik tarzda qurish yondashuvi
keltirildi. O'zbek WordNetini yaratish uchun Turk WordNetdan asos sifatida foydalandik. So'zlarning
mos tarjima va izohlari ma'lumotlar bazasiga mutaxassislar va turli xil leksik manbalardan (bir tilli va ikki
tilli lug'atlar) tekshirilib ko'chirildi. Bizning yondashuvimizda O'zbek WordNetini qisqa vaqt ichida to'liq
yaratish uchun bir qator vazifalar yechimlari taqdim etilgan.