LABORATORIYA ISHI № 8
Mavzu: LINUX OTda nutqli tovushlarni o’rganish muxiti
Ishdan maqsad: LINUX OTda nutqli tovushlarni o’rganish muxiti o’rganish.
Nazariy qism
Nutq odamlar o'rtasida ma'lumot almashishning eng qulay va tanish usuli bo'lib qolmoqda. Mashinalar bilan aloqa o'rnatishda shunga o'xshash "interfeys" ni olish istagi tushunarli. Darhaqiqat, bunday qurilmalar tobora ko'paymoqda. Telefonlar va muzlatgichlar, avtoulovlar va xavfsizlik tizimlari, savdo, tibbiyot, aviatsiya uskunalari va boshqa ko'p narsalar inson nutqini aniqlash (ASR) va sintez (TTS) funktsiyalariga ega. Va, albatta, kompyuterlar.
Nutq sintezatorlari qanday ishlashi haqida bir necha so'z
Inson tili asosan bir bo'g'inli va ikki bo'g'inli tovushlardan (alofonlar va difonlar) iborat deb ishoniladi. Ushbu tovushlar to'plami har qanday til uchun tuzilishi mumkin. Bu alifbodan ancha katta, masalan, frantsuz tilida, ularning soni 1200 ga yaqin. Tovushlar insonning haqiqiy ovozini yozib olishdan olinadi va audiofayl sifatida ma'lumotlar bazasiga joylashtiriladi.
Kompyuter matnni so'zlarga, so'zlarni tovushlarga ajrata oladi, so'ngra zarurini tanlaydi va ularni uzluksiz tovush oqimiga yopishtiradi. Matnni tahlil qilishda uning o'ziga xosligi (texnikasi badiiy yoki she'riyatga qaraganda boshqacha o'qilishi kerak), gapning mohiyati (deklarativ, so'roq, undov), so'zlardagi pauzalarning joylashishi, so'zlar va jumlalar o'rtasida hisobga olinadi. Olingan ovozli signalni tushunishni yaxshilash yoki nutq tempini o'zgartirish uchun filtrlash mumkin. Turli xil ovozlarga ega bo'lish uchun, masalan, erkak va ayol, siz turli xil tovush asoslariga ega bo'lishingiz kerak.
Har bir tilda standart bo'lmagan talaffuz qoidalariga ega so'zlar mavjud. Bunday so'zlar uchun maxsus lug'at tuzilgan - leksika. Matnni tahlil qilishda kompyuter so'zni birinchi navbatda leksikodan izlaydi, agar u yo'q bo'lsa, u holda ushbu til uchun qoidalarga muvofiq tovushlarni chiqaradi.
Internetda nima topildi
https://yandex.ru/video/preview/?text=%D0%A1%D1%80%D0%B5%D0%B4%D0%B0+%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D1%8F+%D0%B7%D0%B2%D1%83%D0%BA%D0%B0%D0%BC+%D1%80%D0%B5%D1%87%D0%B8+%D0%BD%D0%B0+LINUX+OT&path=wizard&parent-reqid=1604047304785229-396869746888939327600274-production-app-host-sas-web-yp-9&wiz_type=vital&filmId=891613038016056009&url=http%3A%2F%2Fwww.youtube.com%2Fwatch%3Fv%3D5ZtyZTZLCOM
Endi Linux uchun ushbu sohada nima borligini ko'rib chiqamiz. Google quyidagilarni e'lon qildi:
Festival nutqni sintez qilish tizimi - Festival bu CSTR da ishlab chiqilgan umumiy ko'p tilli nutq sintez tizimidir. U turli xil API-lar bilan nutq tizimiga to'liq matnni, shuningdek nutqni sintez qilish texnikasini ishlab chiqish va tadqiq qilish muhitini taqdim etadi.
Festvox loyihasi - ingliz va boshqa tillarda yangi nutq sintezi ovozlarini yaratish uchun bepul dasturiy vositalar va hujjatlar. Karnegi Mellondan.
Unix nutqni tanib olish - Maxsus Synaps TAP Workstation nutqni tanib olish bilan barcha muhitlarni boshqarish uchun Unix, mainfame va Mac-ni boshqarish uchun nutqni sichqoncha hodisalariga va klaviatura tugmachalariga aylantiradi.
Karnay - Konqueror uchun nutqqa matn - Linux ostida KDE ish stoli fayl menejeri uchun nutqqa matn.
Flite - Flite (festival-lite) - bu CMU da ishlab chiqarilgan va asosan kichik ko'milgan mashinalar va / yoki katta serverlar uchun mo'ljallangan kichik, tezkor ishlaydigan vaqt sintezi dvigatelidir.
FreeTTS 1.1.1 - to'liq JavaTM dasturlash tilida yozilgan nutq sintezatori
KVoiceControl - shunchaki ayting! - Kvoicecontrol - bu nutqni aniqlash tizimi, bu foydalanuvchilarga so'zlashuvchi buyruqlarni Linux / unix buyruqlariga aylantirishga imkon beradi. KDE va X oynalari uchun.
MBROLA LOYIHASI - nutq sinteziga ko'p tilli matn. Tadqiqot maqsadida bepul ko'p platformali dasturiy ta'minotni yuklab olish.
FreeSpeech - Linux uchun nutqni bepul aniqlash - Openmind (Freespeech) - bu Linux uchun nutqni tanib olish bo'yicha bepul loyihadir. U har qanday dastur yoki oyna boshqaruvchisiga, shuningdek KDE va Ggnome ish stoli muhitlariga osonlikcha qo'shilishi uchun ishlab chiqilgan.
Linux uchun IBM ViaVoice SDK - ViaVoice Kit Linux yordamida nutqni aniqlashni o'z ichiga olgan dasturlarni ishlab chiqish uchun zarur vositalarni taqdim etadi.
DDLinux nutqni aniqlashni pochta orqali jo'natish - Linux uchun nutqni aniqlash dasturining e'lonlari.
BaBel Technologies - MBROLA ning o'ziga xos xususiyati sintetik difonlarni yaratish uchun ishlatiladigan asl jarayonda mavjud. Multi-Band Excited (MBE) tahliliga asoslangan ushbu yondashuv birlashma nuqtalarini spektral tekislashiga imkon beradi va boshqa birlashtiruvchi tizimlarga qaraganda ancha tabiiy ovoz chiqaradi.
Bayonne - GNU loyihasining telefoniya serveri - Bayonne GNU loyihasining bepul ko'p tarmoqli telefon serveridir. LINUX / UNIX uchun manba kodi, xabar almashish uchun mo'ljallangan, juda kengaytiriladigan IVR. Bayonne modulli arxitektura, mahalliy skript va TGI-ni qo'llab-quvvatlaydi.
Juda ko'p emas, lekin nutqni tanib olish va nutqni sintez qilish tizimlari mavjud. Ushbu sharhda biz termoyadroviy tizimlarni ko'rib chiqamiz.
Do'stlaringiz bilan baham: |