Inson nutqini tan olish eng murakkab ilmiy-texnikaviy muammolardan biridir. Hozirgi vaqtda dasturlash sohasida mutaxassis bo'lmagan odamlar kompyuterlar va kompyuterlar bilan jihozlangan asboblardan foydalanuvchiga aylanishadi. Nutqni nazorat qilish muammosi, qo'shimcha ravishda, nutqni qo'llashning ba'zi sohalarida texnologiya bilan aloqa qilishning yagona mumkin bo'lgan vositasiga aylanganligi sababli paydo bo'ldi (ortiqcha yuk, qorong'ulik yoki yorug'likning keskin o'zgarishi, qo'llar band bo'lganda, ekstremal konsentratsiya sharoitida). diqqatni bir soniya chalg'itishga yo'l qo'ymaydigan ob'ektga qaratish va hokazo). Garchi bu sohada sezilarli yutuqlarga erishilgan bo'lsa-da, shunga qaramay, tan olish tizimlari o'z imkoniyatlari bo'yicha hali ham inson imkoniyatlaridan juda uzoqdir.
Inson va texnik vositalar o'rtasidagi nutq dialogini amalga oshirish muammosi zamonaviy kibernetikaning dolzarb vazifasidir.
Mashina nutqini aniqlash muammosi juda uzoq vaqt davomida mutaxassislar e'tiborini tortdi. Shunga qaramay, bu yo'nalishda uzoqqa borishning hali imkoni yo'q. Sof rasmiy ravishda, nutqni aniqlash jarayonini bir nechta iboralar bilan tom ma'noda tasvirlash mumkin. Mikrofon tomonidan yaratilgan analog signal raqamlashtiriladi, so'ngra nutqda fonema deb ataladigan narsalar, ya'ni barcha og'zaki so'zlarni tashkil etuvchi elementar bo'laklar ajratiladi. So`ngra qaysi so`z fonemalarning qaysi birikmasiga mos kelishi aniqlanadi va tegishli lug`at tuziladi. So'zni tanib olish bu lug'atda fonemalarning talaffuz qilingan birikmasi orqali topishni anglatadi. Kompyuter tizimlarining rivojlanishi bilan, agar to'g'ridan-to'g'ri kompyuter bilan ishlashda inson nutqidan foydalanish mumkin bo'lsa, xususan, mashinani boshqarish imkoniyati paydo bo'lsa, ushbu tizimlardan foydalanish sezilarli darajada kengayib borishi tobora ayon bo'lmoqda. real vaqtda oddiy ovoz, shuningdek, oddiy odam nutqi shaklida kirish va chiqish ma'lumotlari.
Hozirgi vaqtda robotni ovozli buyruqlar yordamida boshqarish tobora dolzarb bo'lib bormoqda. Biroq, sanoat robotining ovozli boshqaruvi uchun dasturiy ta'minotni yaratish dasturni ishlab chiqishning barcha bosqichlarida tajribalar o'tkazishni o'z ichiga oladi. Kamchiliklarni, dastur xatolarini bartaraf etishni ta'minlaydigan bunday tajribalarni o'tkazish sanoat ishlab chiqarishida iqtisodiy jihatdan foydasiz bo'lib, dasturiy ta'minotni ishlab chiqish va tuzatish xarajatlarining oshishiga olib keladi. Dasturiy ta'minotni yaratish xarajatlarini kamaytirish uchun sanoat robotining ovozli boshqaruvini uch o'lchovli modellashtirishni ta'minlaydigan dasturni ishlab chiqish maqsadga muvofiqdir, bu esa ishlab chiqarish sharoitida tajribalarni faqat dasturiy ta'minotni ishlab chiqishning oxirgi bosqichida o'tkazish zarurligiga olib keladi.
Ushbu tadqiqot mavzusi sanoat robotlari ishlashining uch o'lchovli modellarini ovozli boshqarishdir. Uning vazifalari - audio signallarni raqamli qayta ishlash usullarini tahlil qilish, nutqni aniqlash tizimlarini tahlil qilish, sanoat robotlarini boshqarish buyruqlarini tanib olish uchun dasturiy ta'minotni ishlab chiqish.
Diskret signallar va ularni o'zgartirish usullari
Inson ovoz yo'lida hosil bo'ladigan akustik tebranish doimiy o'zgaruvchan jarayondir. Matematik nuqtai nazardan, uni uzluksiz vaqt funksiyasi bilan tavsiflash mumkin 1. Analog (vaqt bo'yicha uzluksiz) signallar xa (1) bilan belgilanadi. Nutq signali raqamlar ketma-ketligi sifatida ham ifodalanishi mumkin. Ketma-ketliklar x (n) bilan belgilanadi. Agar raqamlar ketma-ketligi vaqti-vaqti bilan T oralig'ida olingan analog signalning bir lahzali qiymatlari ketma-ketligi bo'lsa, unda bu namuna olish operatsiyasi xa (nT) bilan belgilanadi. Shaklda. 1.1 analog shaklda va 8 kHz namuna olish tezligida olingan namunalar ketma-ketligi sifatida nutq signalining namunasini ko'rsatadi.
Nutq taqdimoti
Qulaylik uchun, hatto diskret signallarni ko'rib chiqishda ham, ba'zan doimiy funksiya grafikda tasvirlangan bo'lib, uni namunalar ketma-ketligining konverti sifatida ko'rib chiqish mumkin. Raqamli nutqni qayta ishlash tizimlarini o'rganishda bir nechta maxsus ketma-ketliklar talab qilinadi. Bitta namuna yoki bitta impulsning ketma-ketligi quyidagicha aniqlanadi
(1.1)
Yagona sakrashning ketma-ketligi shaklga ega
(1.2)
Eksponensial ketma-ketlik
(1.3)
Agar a kompleks son bo'lsa, ya'ni
(1.4)
Agar z = 1 va x (n) kompleks sinusoid bo'lsa; agar . x (n) haqiqiy; agar z <1 va u holda x (n) eksponensial yemiruvchi tebranuvchi ketma-ketlikdir. Ushbu turdagi ketma-ketliklar ko'pincha chiziqli tizimlarni ifodalashda va nutq signallarini modellashtirishda qo'llaniladi.
Signalni qayta ishlash ularni keyingi foydalanish uchun qulay bo'lgan shaklga aylantirishni o'z ichiga oladi. Shunday qilib, qiziqish mavzusi diskret tizimlar yoki xuddi shu tarzda kirish ketma-ketligini chiqishga aylantirishdir. Bunday o'zgarishlar strukturaviy diagrammalarda qo'shimcha ravishda tasvirlangan. Ko'pgina nutqni tahlil qilish tizimlari nutq to'lqin shaklining bir lahzali qiymatlari ketma-ketligidan vaqt o'zgaruvchan parametrlarni baholash uchun mo'ljallangan. Bunday tizimlar ko'p o'lchovli chiqishga ega, ya'ni kirishda nutq signali bo'lgan bir o'lchovli ketma-ketlik chiqishda vektor ketma-ketligiga aylanadi.
Nutq signallarini qayta ishlashda, ayniqsa, vaqt o'zgarishiga o'zgarmas tizimlar keng qo'llaniladi. Bunday tizimlar bitta impulsga javob bilan to'liq tavsiflanadi.Tizimning chiqishidagi signal kirishdagi signaldan va diskret konvolyutsiya yordamida bitta impulsga h (n) javobidan hisoblanishi mumkin.
(1.5a)
bu erda * belgisi konvolyutsiyani bildiradi. Ekvivalent ifoda hisoblanadi
(1.5б)
Vaqt o'zgarmas chiziqli tizimlar signalni filtrlashda qo'llaniladi va eng muhimi, ular nutq ishlab chiqarish modellari sifatida foydalidir.
Signalni tahlil qilish va tizimni loyihalash ularni chastotalar sohasida tavsiflash orqali sezilarli darajada osonlashadi. Shu munosabat bilan, Furye transformatsiyasi va z-transformatsiyasi yordamida signallar va tizimlarning diskret vaqtdagi tasviri haqida qisqacha to'xtalib o'tish maqsadga muvofiqdir.
Ketma-ketlikning to'g'ridan-to'g'ri va teskari r-transformatsiyasi ikkita tenglama bilan aniqlanadi:
(1.6a)
(1.6б)
To'g'ridan-to'g'ri z-transformatsiyasi x (n) (1.6a) tenglama bilan aniqlanadi. Umuman olganda, X (z) z-1 darajalarida cheksiz qatordir; ketma-ketlik x (n) qator koeffitsientlari rolini o'ynaydi. Umumiy holda, bunday quvvat seriyalari faqat z ning ba'zi qiymatlari uchun cheklangan chegaraga yaqinlashadi. Konvergentsiya uchun etarli shart shaklga ega
(1.7)
Ketma-ket yaqinlashadigan qiymatlar to'plami konvergentsiya mintaqasi deb nomlanuvchi murakkab tekislikdagi mintaqani tashkil qiladi. Umuman olganda, bu mintaqa shaklga ega
Furye konvertatsiyasi yordamida diskret vaqtdagi signalning tavsifi shaklda berilgan
(1.9a)
(1.9б)
Bu tenglamalar tenglamalarning maxsus holatidir (1.6a, b).
Furye konvertatsiyasi z-transformani birlik doirasi bo'yicha hisoblash, ya'ni almashtirish yo'li bilan olinadi. Chastotani z-tekisligidagi burchak sifatida talqin qilish mumkin. Furye konvertatsiyasining mavjudligi uchun etarli shartni (1.7) da almashtirish orqali olish mumkin.
(1.10)
Ketma-ketlikni Furye konvertatsiyasining muhim xususiyati shundaki, u 2k davriga ega bo'lgan davriy funktsiyadir. Boshqa tomondan, u birlik doiradagi X (z) qiymatini ifodalaganligi sababli, bu aylananing har bir to'liq o'tishidan keyin, ya'ni raddan radga o'tgandan keyin takrorlanishi kerak.
Diskret Furye transformatsiyasi
Analog signallarda bo'lgani kabi, ketma-ketlik N davri bilan davriy bo'lsa, ya'ni.
(1.11)
u holda x (n) integral sifatida emas, balki sinusoidlar yig'indisi sifatida ifodalanishi mumkin. Davriy ketma-ketlik uchun Furye konvertatsiyasi shaklga ega
(1.12а)
(1.12б)
Bu davriy ketma-ketlikning aniq ifodasidir. Biroq, bu tavsifning asosiy afzalligi tenglamalarni biroz boshqacha talqin qilish imkoniyatidadir (1.12). B oraliqdan tashqarida nolga teng chekli x (n) uzunlikdagi ketma-ketlikni ko'rib chiqing, bu holda z-transformasi ko'rinishga ega bo'ladi.
(1.13)
Agar biz birlik doiraning N teng masofali nuqtalariga X (z) ni yozsak, ya'ni k = 0, 1, ..., N-1, u holda biz hosil bo'lamiz.
(1.14)
Agar bir vaqtning o'zida x (n) segmentining cheksiz ko'p takrorlanishi shaklida davriy ketma-ketlik tuzilsa,
(1.15)
u holda (1.12a) va (1.14) dan ko'rinib turibdiki, namunalar (1.15) davriy ketma-ketlikning x (n) Furye koeffitsientlarini ifodalaydi. Shunday qilib, N uzunlikdagi ketma-ketlikni diskret Furye konvertatsiyasi (DFT) shaklida aniq tasvirlash mumkin.
(1.16)
(1.17)
Shuni yodda tutish kerakki, DFT dan foydalanilganda barcha ketma-ketliklar xuddi davriy funksiyalar kabi harakat qiladi, ya'ni DFT aslida (1.15) bilan berilgan vaqtning davriy funktsiyasining ifodasidir. DFT dan foydalanishda biroz boshqacha yondashuv shundan iboratki, ketma-ketlik indekslari N moduli bilan talqin qilinadi. Bu shundan kelib chiqadiki, agar x (n) uzunligi N bo'lsa, u holda
Ikkitomonlama yozuvning kiritilishi DFT tasvirining o'ziga xos davriyligini aks ettirishga imkon beradi. Ushbu davriylik DFT xususiyatlariga sezilarli ta'sir qiladi. Shubhasiz, ketma-ketlikni kechiktirish moduli N deb hisoblanishi kerak. Bu, masalan, diskret konvolyutsiyani amalga oshirishning ba'zi o'ziga xos xususiyatlariga olib keladi.
Diskret Furye transformatsiyasi barcha xususiyatlari bilan quyidagi sabablarga ko'ra signallarni tavsiflashning muhim usuli hisoblanadi: 1) DFTni chekli davomiylik ketma-ketligining z -transformatsiyasining (yoki Furye konvertatsiyasining) diskretlashtirilgan versiyasi sifatida ko'rish mumkin; 2) DFT o'z xususiyatlariga ko'ra (davriylikni hisobga olgan holda) Furye transformatsiyasi va z-transformatsiyasi bilan juda o'xshash; 3) X (k) ning N qiymatlarini Fourier tez transformatsiyasi (FFT) deb nomlanuvchi samarali (NlogN ga proportsional hisoblash vaqti) algoritmlar oilasi yordamida hisoblash mumkin.
Diskret Furye konvertatsiyasi korrelyatsiya funksiyalarini, spektrlarni hisoblashda va raqamli filtrlarni amalga oshirishda keng qo'llaniladi va nutq signallarini qayta ishlashda ham qo'llaniladi [1-5].1>
Do'stlaringiz bilan baham: |