Amaliy mashg‘ulot №23
Mavzu:
LINUX OTda nutqli tovushlarni o‘rganish muxiti
Ishdan maqsad:
LINUX OTda nutqli tovushlarni o‘rganish muxiti o‘rganish.
Nazariy qism
Nutq odamlar o'rtasida ma'lumot almashishning eng qulay va tanish usuli bo'lib
qolmoqda. Mashinalar bilan aloqa o'rnatishda shunga o'xshash "interfeys" ni olish istagi
tushunarli. Darhaqiqat, bunday qurilmalar tobora ko'paymoqda. Telefonlar va
muzlatgichlar, avtoulovlar va xavfsizlik tizimlari, savdo, tibbiyot, aviatsiya uskunalari
va boshqa ko'p narsalar inson nutqini aniqlash (ASR) va sintez (TTS) funktsiyalariga
ega. Va, albatta, kompyuterlar.
Nutq sintezatorlari qanday ishlashi haqida bir necha so'z
Inson tili asosan bir bo'g‘inli va ikki bo'g‘inli tovushlardan (alofonlar va difonlar)
iborat deb ishoniladi. Ushbu tovushlar to'plami har qanday til uchun tuzilishi mumkin.
Bu alifbodan ancha katta, masalan, frantsuz tilida, ularning soni 1200 ga yaqin.
Tovushlar insonning haqiqiy ovozini yozib olishdan olinadi va audiofayl sifatida
ma'lumotlar bazasiga joylashtiriladi.
Kompyuter matnni so'zlarga, so'zlarni tovushlarga ajrata oladi, so'ngra zarurini
tanlaydi va ularni uzluksiz tovush oqimiga yopishtiradi. Matnni tahlil qilishda uning
o'ziga xosligi (texnikasi badiiy yoki she'riyatga qaraganda boshqacha o'qilishi kerak),
gapning mohiyati (deklarativ, so'roq, undov), so'zlardagi pauzalarning joylashishi,
so'zlar va jumlalar o'rtasida hisobga olinadi. Olingan ovozli signalni tushunishni
yaxshilash yoki nutq tempini o'zgartirish uchun filtrlash mumkin. Turli xil ovozlarga
ega bo'lish uchun, masalan, erkak va ayol, siz turli xil tovush asoslariga ega bo'lishingiz
kerak.
Har bir tilda standart bo'lmagan talaffuz qoidalariga ega so'zlar mavjud. Bunday
so'zlar uchun maxsus lug‘at tuzilgan -
leksika.
Matnni tahlil qilishda kompyuter so'zni
birinchi navbatda leksikodan izlaydi, agar u yo'q bo'lsa, u holda ushbu til uchun
qoidalarga muvofiq tovushlarni chiqaradi.
Endi Linux uchun ushbu sohada nima borligini ko'rib chiqamiz. Google
quyidagilarni e'lon qildi:
Festival nutqni sintez qilish tizimi - Festival bu CSTR da ishlab chiqilgan
umumiy ko'p tilli nutq sintez tizimidir. U turli xil API-lar bilan nutq tizimiga to'liq
matnni, shuningdek nutqni sintez qilish texnikasini ishlab chiqish va tadqiq qilish
muhitini taqdim etadi.
Festvox loyihasi - ingliz va boshqa tillarda yangi nutq sintezi ovozlarini yaratish
uchun bepul dasturiy vositalar va hujjatlar. Karnegi Mellondan.
Unix nutqni tanib olish - Maxsus Synaps TAP Workstation nutqni tanib olish
bilan barcha muhitlarni boshqarish uchun Unix, mainfame va Mac-ni boshqarish uchun
nutqni sichqoncha hodisalariga va klaviatura tugmachalariga aylantiradi.
Karnay - Konqueror uchun nutqqa matn - Linux ostida KDE ish stoli fayl
menejeri uchun nutqqa matn.
Flite - Flite (festival-lite) - bu CMU da ishlab chiqarilgan va asosan kichik
ko'milgan mashinalar va / yoki katta serverlar uchun mo'ljallangan kichik, tezkor
ishlaydigan vaqt sintezi dvigatelidir.
FreeTTS 1.1.1 - to'liq JavaTM dasturlash tilida yozilgan nutq sintezatori
KVoiceControl - shunchaki ayting! - Kvoicecontrol - bu nutqni aniqlash tizimi,
bu foydalanuvchilarga so'zlashuvchi buyruqlarni Linux / unix buyruqlariga
aylantirishga imkon beradi. KDE va X oynalari uchun.
MBROLA LOYIHASI - nutq sinteziga ko'p tilli matn. Tadqiqot maqsadida bepul
ko'p platformali dasturiy ta'minotni yuklab olish.
FreeSpeech - Linux uchun nutqni bepul aniqlash - Openmind (Freespeech) - bu
Linux uchun nutqni tanib olish bo'yicha bepul loyihadir. U har qanday dastur yoki oyna
boshqaruvchisiga, shuningdek KDE va Ggnome ish stoli muhitlariga osonlikcha
qo'shilishi uchun ishlab chiqilgan.
Linux uchun IBM ViaVoice SDK - ViaVoice Kit Linux yordamida nutqni
aniqlashni o'z ichiga olgan dasturlarni ishlab chiqish uchun zarur vositalarni taqdim
etadi.
DDLinux nutqni aniqlashni pochta orqali jo'natish - Linux uchun nutqni aniqlash
dasturining e'lonlari.
BaBel Technologies - MBROLA ning o'ziga xos xususiyati sintetik difonlarni
yaratish uchun ishlatiladigan asl jarayonda mavjud. Multi-Band Excited (MBE)
tahliliga asoslangan ushbu yondashuv birlashma nuqtalarini spektral tekislashiga
imkon beradi va boshqa birlashtiruvchi tizimlarga qaraganda ancha tabiiy ovoz
chiqaradi.
Bayonne - GNU loyihasining telefoniya serveri - Bayonne GNU loyihasining
bepul ko'p tarmoqli telefon serveridir. LINUX / UNIX uchun manba kodi, xabar
almashish uchun mo'ljallangan, juda kengaytiriladigan IVR. Bayonne modulli
arxitektura, mahalliy skript va TGI-ni qo'llab-quvvatlaydi.
Juda ko'p emas, lekin nutqni tanib olish va nutqni sintez qilish tizimlari mavjud.
Ushbu sharhda biz termoyadroviy tizimlarni ko'rib chiqamiz.
Do'stlaringiz bilan baham: |