Amaliy mashg’ulot №5
Mavzu: Nutqni aniqlash bosqichlari
Ishdan maqsad: Nutqni aniqlash bosqichlari o’rganishdan iborat
Nazariy qism.
Nutqni tanib olish - bu mashina yoki dasturning og'zaki tilda so'zlarni va so'z birikmalarini aniqlash va ularni mashinada o'qiladigan formatga aylantirish qobiliyatidir. Nutq - bu tovushlarning ketma-ketligi. Ovoz, o'z navbatida, turli chastotalardagi tovush to'lqinlarining superpozitsiyasidir. To'lqin, fizikadan ma'lumki, ikkita atribut bilan tavsiflanadi - amplituda va tezlik. Ovoz signalini raqamli muhitda saqlash uchun uni bir necha oraliqlarga bo'lish va ularning har biri uchun ma'lum bir "o'rtacha" qiymatni olish kerak. Shunday qilib, mexanik tebranishlar zamonaviy kompyuterlarda ishlov berish uchun mos bo'lgan raqamlar to'plamiga aylantiriladi. Oddiy nutqni aniqlash dasturi so'zlar va so'z birikmalarining cheklangan lug'atiga ega va shuning uchun u so'zlarni talaffuzi juda aniq bo'lsa aniqlay oladi. Keyinchalik murakkab dastur tabiiy nutqni qabul qilish qobiliyatiga ega.
Nutqni aniqlash ikki algoritm asosida ishlaydi: akustik va tilni modellashtirish. Akustik modellashtirish - bu nutqning lingvistik birliklari va audio signallari o'rtasidagi munosabatlar; tilni modellashtirish tovushlarni so'zlar ketma-ketligi bilan bir-biriga mos ravishda bir xil tovushlarni farqlashga yordam beradi. Nutqni avtomatik ravishda matnga aylantirish jarayoni ifoda sifatida ifodalanishi mumkin
Nutq mikrofondagi tovushga sezgir element tomonidan ushlanib qoladi, bu o'zgaruvchan tovush bosimini elektr signalidagi ekvivalent o'zgarishlarga, ya'ni oqim yoki voltajga aylantiradi. Keyin ushbu analog signal namuna olinadi va raqamli bitli oqimga (formatga) kvantlanadi. Keyinchalik, namuna olish sodir bo'ladi - har bir T vaqtidagi analog signal qiymatlarini olish jarayoni, bu erda har bir namuna olish vaqtidagi amplitudani berilgan bit uzunligiga ega bo'lgan diskret ikkilik songa aylantirish orqali kvantizatsiya olinadi. Ushbu ikki bosqichli jarayon ba'zan Pulse Code Modulation (PCM) deb nomlanadi. Hz dagi sekundiga namunalar (chastota) fs teskari tanlab olish davriga teng, ya'ni fs = 1 / T Namuna olish teoremasi shuni ko'rsatadiki, namuna olish darajasi signalda mavjud bo'lgan eng yuqori chastota komponentidan kamida ikki baravar ko'p bo'lishi kerak. Agar kamroq namunalar ishlatilsa, demontaj deb nomlanadigan hodisa ro'y beradi, bu erda qayta qurishda past chastotali signal paydo bo'lishi mumkin. Odatda nutq uchun namuna olish darajasi taxminan 3,3 kHz. 6-20 kHz da Nyquist chastotasidan yuqori chastotali komponentlarni olib tashlash uchun oldindan namuna olish yoki yumshatishga qarshi filtr talab qilinadi.
Do'stlaringiz bilan baham: |