4.5. Signalning kepstral parametrlarini hisoblash algoritmi
“Kepstr” atamasi chiziqli bo‘lmagan filtrlash yordamida signallarning siqilgan, ixcham tasvirini spektral o‘zgartirish qiymatlarining logarifmini olishni anglatadi. Ko‘pincha nutq signallarini qayta ishlashda kepstral ifodalashdan foydalaniladi. Biroq, ovoz traktining tug‘ma xususiyatlari va ishlatiladigan nutq uslubiyati tufayli har bir shaxsning nutqi takrorlanmas hisoblanadi. Nutqni tanib olishning ko‘plab usullari mavjud, aksariyat hollarda ularning barchasi statistik tahlil va ehtimollar nazariyasiga asoslangan. Shu bilan birga, birinchi bosqichda har doim akustik tahlil usullari qo‘llaniladi. Akustik daraja – bu ishlov berishning dastlabki bosqichi hisoblanadi, chunki u faqat audio signalga tegishli. Akustik jarayonlarni o‘rganish ovozli signalni yozib olish, raqamli qayta ishlash va
64
parametrlashni o‘z ichiga oladi. Xususiyatlarni ajratib olish jarayonining maqsadi –
kiruvchi akustik signalini ba’zi bir ixcham parametrli tasvirlash shakliga aylantirishdir [8].
Nutqni talaffuz qilish jarayonida o‘zgartirishi mumkin bo‘lgan va o‘rganish davomida miqdoriy ko‘rsatkichlarni aniqlash mumkin bo‘lgan asosiy parametrlari ham vaqt sohasi bo‘yicha ham va spektral o‘zgartirishlarning natijalaridir.
Vaqt sohasi bo‘yicha o‘zgartirish algoritmlarining parametrlari lokal parametrlarni o‘z ichiga oladi, ularni aniqlash algoritmlari oldinroq berilgan edi. Spektral o‘zgartirishlar parametrlarini aniqlash algoritmlari (signal fragmentlari spektrlari) tegishli bobla bayon etiladi. Ishlov berish zanjirida keyingi bosqichda nutq signallarining integral parametrlarini aniqlash algoritmlari: kepstral koeffitsiyentlarni aniqlash, formant chastotalarini ajratib olish va asosiy ton chastotasini shakllantirish amalga oshiriladi.
Tanib olish tizimlarida nutq signali fragmentlarga bo‘linadi, har bir fragment belgilar vektoriga aylantiriladi, natijada kirish signali funksiya vektorlari to‘plamining ketma-ketligi yoki parametrli tasvir bilan ifodalanadi. Noyob xususiyatli vektor sifatida kepstr koeffitsiyentlarning bir o‘lchovli chastota vektori, shuningdek uning hosilalaridan tashkil topgan vektor ishlatiladi.
Kepstr parametrlarni aniqlashning hisoblash algoritmi avvalgi bo‘limlarda tasvirlangan ishlov berishning dastlabki bosqichlari natijalariga asoslangan: bo‘laklarga bo‘lish, Xemming oynasidan o‘tkazish vaDKO‘ algoritmibilan spektrni olish. Mel-chastota kepstr koyeffitsiyentlari (Mel-frequency cepstrum coefficients – MFCC) axborot xususiyatlari sifatida ishlatiladi. Ular ikkita asosiy filtrlash tushunchalariga asoslangan: kepstr va mel-shkala. Kepstr – bu signalning amplituda spektrining logarifmidan olingan DKO‘ natijasi [8, 9] .
Joriy ishlov berishda, ya’ni nutq signalining fragmentlaridan birini qayta ishlashda, DKO‘ yoyilmasining 2ⁿ = 256 spektral koeffitsiyentlari olinadi. «Mel -shkalasi» yordamida DKO‘ amplituda spektri chiziqli bo‘lmagan (logarifmik) mel-shkalada joylashgan «uchburchak» chastota diapazonlari doirasidagi spektral
65
koeffitsiyentlarning amplitudalarini qo‘shib silliqlanadi (4.8-rasm) ). Sodda shakl
uchun ularning soni 12 ga teng.
081 0,64 044) 02
2000 4000 5006 8000 4.8-rasm. 12 diapazonli mel-chastotali filtrlarning tarog‘i
Yuqorida mel-shkalada olingan spektrni parchalash uchun filtrlarning “taroqchasini” hosil qilish kerak, bu yerda har bir mel-filtr uchburchak oynaning funksiyasi bo‘lib, u ma’lum bir chastota diapazonidagi energiya miqdorini yig‘ishga va shu bilan Mel-koeffitsiyentini olish imkon beradi. Mel-koeffitsiyentlarining qiymatlari va tahlil qilingan chastota diapazoniga ega bo‘lgan holda, bunday filtrlar to‘plamini qurish mumkin. Mel-koeffitsiyentining tartib raqami qancha ko‘p bo‘lsa, filtr poydevori shunchalik keng bo‘ladi.
Xomaki namunasi uchun diskretlash chastotasi 16 kGs bo‘lgan 24 chastota diapazoni olinadi. Birinchi amplituda koeffitsiyenti - spektrning doimiy komponenti e’tiborga olinmaydi, qolgan 255 spektral koeffitsiyent amplitudasi 24 uchburchak filtrlar orqali o‘rtacha hisoblanadi. Ushbu diapazonlarning chastotalari 4.1-jadvalda keltirilgan.
O‘rtacha vazn ma’lum bir filtr uchun quyi va yuqori chastotalar orasidagi chastotalarga mos keladigan amplituda spektral koeffitsiyentlaruchuntopiladi. Agar amplituda polosasining markaziy chastotasiga to‘liq mos keladigan bo‘lsa, unda 1-koeffitsiyentiga ko‘paytiriladi.
Amplituda qiymatiga mos keladigan chastotani o‘rtadan quyi yoki yuqori
chegaraga o‘tkazishda koeffitsiyent 1 dan nolga kamayadi. Amplitudalarning 66
koeffitsiyentlar bo‘yicha hosilalari yig‘ilib, amplituda qiymatlari soniga bo‘linadi.
Bu ma’lum bir chastota diapazoni uchun o‘rtacha og‘irlik.
Do'stlaringiz bilan baham: |