p
-bo
b
, bo
d
-bo
t
singari leksik birliklar shular jumlasidandir. Yozuv va
talaffuzdagi nomuvofiqlik esa nutqni sintezlash jarayonining murakkablashuviga sabab boʻladi.
Oʻzbek nutq sintezatorining dastlabki talqini uchun lingvistik bazani shakllantirish jarayonida
bu boradagi muammolarni hal etishda “Oʻzbek tili omonimlarining izohli lugʻati” va uning
asosida tayyorlangan ma’lumotlar bazasida qayd etilgan omofonlar [Rahmatullayev, 1984: 216;
Abjalova, 2019] asosiy manba sifatida xizmat qildi.
Oʻzbek nutq sintezatorining lingvistik bazasi uchun morfologik lugʻatlar nihoyatda
muhimdir. Avtomatik tahlil va sintez dasturlari konteksda uchraydigan omograflar (
tok
– uzum
butasi,
tok
– elektr quvvati
)ning talaffuzdagi ifodasini farqlay olishi, til birliklarining sintagmatik
munosabatga kirishib, valentlik hosil qilish imkoniyatlarini toʻgʻri aniqlashi uchun morfologik
birliklarning lingvistik modellarini ishlab chiqish zarur.
Leksik hamda grammatik valentlik hosil qiluvchi lisoniy birliklar assotsiativ tafakkur
mahsuli sifatida namoyon boʻladi. Shu jihatdan “Oʻzbek tili assotsiativ lugʻati” [Lutfullayeva,
Davlatova, Tojiboyev, 2019: 332]da mavjud sintagmatik munosabatga asoslangan verbal
assotsiatsiyalar ham nutq sintezatori uchun muhim lingvistik material hisoblanadi. Morfologik
baza orqali lingvistik dasturlar urgʻuning ma’no farqlashi (
akadémik
– ot,
akademи
́ k
- sifat
)
bilan bogʻliq orfoepik me’yorlarni belgilash imkoniyatiga ham ega boʻladi.
Yuqoridagi kabi holatlar dastur bazasini urgʻuli lugʻatlar bilan ta’minlash zarurligini
koʻrsatadi. Bunday lugʻat oʻzlashma soʻzlar talaffuzi bilan bogʻliq muammolar echimi uchun
nihoyatda zarur. Shu jihatdan biz hozirgi kunda tilshunoslikda bu borada ilgari surilgan
nazariyalar [Gʻulomov, 2007: 330; Mirtojiyev, 2013: 171-267; Jamolxonov, 2013: 139-147] va
amaliy izlanish natijalaridan [Asomiddinova, Begmatov, 1984: 559] ijodiy foydalangan holda
“Oʻzlashma soʻzlarning urgʻuli lugʻati” ustida ish olib bormoqdamiz. Oʻzlashma soʻzlar
lugʻatining urgʻuli bazasi oʻzbek tilining izohli lugʻatida mavjud oʻzlashgan hamda kundalik
hayotda koʻp uchraydigan ayrim baynalmilal soʻzlarni oʻz ichiga olgan boʻlib, lugʻat soʻzlari
bazaga kirill va lotin yozuvida kiritilgan. Har ikki yozuvdagi urgʻulari qoʻyilib, bazada ularga
maxsus ID kod (identifikatsiya raqami) berilgan. ID kod dasturda urgʻu qoʻyilgan soʻzning oʻz
ovozli xabari bilan bogʻlanishini ta’minlaydi. Bu esa ovoz bilan ishlashga moʻljallangan
lingvistik dasturlarni tayyorlashga qulaylik yaratish uchun nihoyatda zarur.
Lugʻatning avtomatik tahrir va avtomatik tarjima dasturlarini tayyorlashdagi ahamiyatini
ham hisobga olgan holda, unda oʻzlashma soʻzlar turkumi koʻrsatildi va ularning izohi, mavjud
hollarda ma’nodoshlari berildi.
Oʻzbek tili ovoz sintezatorini leksikografik manbalar bilan ta’minlashda choʻziq unlilar,
sirgʻaluvchi
Do'stlaringiz bilan baham: |