4.5. Signalning kepstral parametrlarini hisoblash algoritmi
“Kepstr” atamasi chiziqli bo‘lmagan filtrlash yordamida signallarning
siqilgan, ixcham tasvirini spektral o‘zgartirish qiymatlarining logarifmini olishni
anglatadi. Ko‘pincha nutq signallarini qayta ishlashda kepstral ifodalashdan
foydalaniladi. Biroq, ovoz traktining tug‘ma xususiyatlari va ishlatiladigan nutq
uslubiyati tufayli har bir shaxsning nutqi takrorlanmas hisoblanadi. Nutqni tanib
olishning ko‘plab usullari mavjud, aksariyat hollarda ularning barchasi statistik
tahlil va ehtimollar nazariyasiga asoslangan. Shu bilan birga, birinchi bosqichda har
doim akustik tahlil usullari qo‘llaniladi. Akustik daraja – bu ishlov berishning
dastlabki bosqichi hisoblanadi, chunki u faqat audio signalga tegishli. Akustik
jarayonlarni o‘rganish ovozli signalni yozib olish, raqamli qayta ishlash va
65
parametrlashni o‘z ichiga oladi. Xususiyatlarni ajratib olish jarayonining maqsadi –
kiruvchi akustik signalini ba’zi bir ixcham parametrli tasvirlash shakliga
aylantirishdir [8].
Nutqni talaffuz qilish jarayonida o‘zgartirishi mumkin bo‘lgan va o‘rganish
davomida miqdoriy ko‘rsatkichlarni aniqlash mumkin bo‘lgan asosiy parametrlari
ham vaqt sohasi bo‘yicha ham va spektral o‘zgartirishlarning natijalaridir.
Vaqt sohasi bo‘yicha o‘zgartirish algoritmlarining parametrlari lokal
parametrlarni o‘z ichiga oladi, ularni aniqlash algoritmlari oldinroq berilgan edi.
Spektral o‘zgartirishlar parametrlarini aniqlash algoritmlari (signal fragmentlari
spektrlari) tegishli bobla bayon etiladi. Ishlov berish zanjirida keyingi bosqichda
nutq signallarining integral parametrlarini aniqlash algoritmlari: kepstral
koeffitsiyentlarni aniqlash, formant chastotalarini ajratib olish va asosiy ton
chastotasini shakllantirish amalga oshiriladi.
Tanib olish tizimlarida nutq signali fragmentlarga bo‘linadi, har bir fragment
belgilar vektoriga aylantiriladi, natijada kirish signali funksiya vektorlari
to‘plamining ketma-ketligi yoki parametrli tasvir bilan ifodalanadi. Noyob
xususiyatli vektor sifatida kepstr koeffitsiyentlarning bir o‘lchovli chastota vektori,
shuningdek uning hosilalaridan tashkil topgan vektor ishlatiladi.
Kepstr parametrlarni aniqlashning hisoblash algoritmi avvalgi bo‘limlarda
tasvirlangan ishlov berishning dastlabki bosqichlari natijalariga asoslangan:
bo‘laklarga bo‘lish, Xemming oynasidan o‘tkazish va DKO‘ algoritmi bilan spektrni
olish. Mel-chastota kepstr koyeffitsiyentlari (Mel-frequency cepstrum coefficients –
MFCC) axborot xususiyatlari sifatida ishlatiladi. Ular ikkita asosiy filtrlash
tushunchalariga asoslangan: kepstr va mel-shkala. Kepstr – bu signalning amplituda
spektrining logarifmidan olingan DKO‘ natijasi [8, 9] .
Joriy ishlov berishda, ya’ni nutq signalining fragmentlaridan birini qayta
ishlashda, DKO‘ yoyilmasining 2ⁿ = 256 spektral koeffitsiyentlari olinadi. «Mel -
shkalasi» yordamida DKO‘ amplituda spektri chiziqli bo‘lmagan (logarifmik) mel-
shkalada joylashgan «uchburchak» chastota diapazonlari doirasidagi spektral
66
koeffitsiyentlarning amplitudalarini qo‘shib silliqlanadi (4.8-rasm) ). Sodda shakl
uchun ularning soni 12 ga teng.
4.8-rasm. 12 diapazonli mel-chastotali filtrlarning tarog‘i
Yuqorida mel-shkalada olingan spektrni parchalash uchun filtrlarning
“taroqchasini” hosil qilish kerak, bu yerda har bir mel-filtr uchburchak oynaning
funksiyasi bo‘lib, u ma’lum bir chastota diapazonidagi energiya miqdorini yig‘ishga
va
shu
bilan
Mel-koeffitsiyentini
olish
imkon
beradi.
Mel-koeffitsiyentlarining qiymatlari va tahlil qilingan chastota diapazoniga ega
bo‘lgan holda, bunday filtrlar to‘plamini qurish mumkin. Mel-koeffitsiyentining
tartib raqami qancha ko‘p bo‘lsa, filtr poydevori shunchalik keng bo‘ladi.
Xomaki namunasi uchun diskretlash chastotasi 16 kGs bo‘lgan 24 chastota
diapazoni olinadi. Birinchi amplituda koeffitsiyenti - spektrning doimiy komponenti
e’tiborga olinmaydi, qolgan 255 spektral koeffitsiyent amplitudasi 24 uchburchak
filtrlar orqali o‘rtacha hisoblanadi. Ushbu diapazonlarning chastotalari 4.1-jadvalda
keltirilgan.
O‘rtacha vazn ma’lum bir filtr uchun quyi va yuqori chastotalar orasidagi
chastotalarga mos keladigan amplituda spektral koeffitsiyentlar uchun topiladi. Agar
amplituda polosasining markaziy chastotasiga to‘liq mos keladigan bo‘lsa, unda 1-
koeffitsiyentiga ko‘paytiriladi.
Amplituda qiymatiga mos keladigan chastotani o‘rtadan quyi yoki yuqori
chegaraga o‘tkazishda koeffitsiyent 1 dan nolga kamayadi. Amplitudalarning
67
koeffitsiyentlar bo‘yicha hosilalari yig‘ilib, amplituda qiymatlari soniga bo‘linadi.
Bu ma’lum bir chastota diapazoni uchun o‘rtacha og‘irlik.
4.1-jadval
Diapazon
Quyi
chastota (Gs)
O‘rta
chastota (Gs)
Yuqori
chastota (Gt)
Do'stlaringiz bilan baham: |