65
parametrlashni o‘z ichiga oladi. Xususiyatlarni ajratib olish jarayonining maqsadi –
kiruvchi akustik signalini ba’zi bir ixcham parametrli
tasvirlash shakliga
aylantirishdir [8].
Nutqni talaffuz qilish jarayonida o‘zgartirishi mumkin bo‘lgan va o‘rganish
davomida miqdoriy ko‘rsatkichlarni aniqlash mumkin bo‘lgan asosiy parametrlari
ham vaqt sohasi bo‘yicha ham va spektral o‘zgartirishlarning natijalaridir.
Vaqt sohasi bo‘yicha o‘zgartirish algoritmlarining parametrlari lokal
parametrlarni o‘z ichiga oladi, ularni aniqlash algoritmlari oldinroq berilgan edi.
Spektral o‘zgartirishlar parametrlarini aniqlash algoritmlari (signal fragmentlari
spektrlari) tegishli bobla bayon etiladi. Ishlov berish
zanjirida keyingi bosqichda
nutq signallarining integral parametrlarini aniqlash algoritmlari: kepstral
koeffitsiyentlarni aniqlash, formant chastotalarini ajratib olish va asosiy ton
chastotasini shakllantirish amalga oshiriladi.
Tanib olish tizimlarida nutq signali fragmentlarga bo‘linadi, har bir fragment
belgilar
vektoriga aylantiriladi, natijada kirish signali funksiya vektorlari
to‘plamining ketma-ketligi yoki parametrli tasvir bilan ifodalanadi. Noyob
xususiyatli vektor sifatida kepstr koeffitsiyentlarning bir o‘lchovli chastota vektori,
shuningdek uning hosilalaridan tashkil topgan vektor ishlatiladi.
Kepstr parametrlarni aniqlashning hisoblash algoritmi avvalgi bo‘limlarda
tasvirlangan ishlov berishning dastlabki bosqichlari natijalariga asoslangan:
bo‘laklarga bo‘lish, Xemming oynasidan o‘tkazish va DKO‘ algoritmi bilan spektrni
olish. Mel-chastota kepstr koyeffitsiyentlari (Mel-frequency cepstrum coefficients –
MFCC) axborot xususiyatlari sifatida ishlatiladi. Ular ikkita asosiy filtrlash
tushunchalariga asoslangan: kepstr va mel-shkala. Kepstr – bu signalning amplituda
spektrining logarifmidan olingan DKO‘ natijasi [8, 9] .
Joriy
ishlov berishda, ya’ni nutq signalining fragmentlaridan birini qayta
ishlashda, DKO‘ yoyilmasining 2ⁿ = 256 spektral koeffitsiyentlari olinadi. «Mel -
shkalasi» yordamida DKO‘ amplituda spektri chiziqli bo‘lmagan (logarifmik) mel-
shkalada joylashgan «uchburchak» chastota diapazonlari doirasidagi spektral
66
koeffitsiyentlarning amplitudalarini qo‘shib silliqlanadi (4.8-rasm) ). Sodda shakl
uchun ularning soni 12 ga teng.
4.8-rasm. 12 diapazonli mel-chastotali filtrlarning tarog‘i
Yuqorida mel-shkalada olingan spektrni parchalash
uchun filtrlarning
“taroqchasini” hosil qilish kerak, bu yerda har bir mel-filtr uchburchak oynaning
funksiyasi bo‘lib, u ma’lum bir chastota diapazonidagi energiya miqdorini yig‘ishga
va
shu
bilan
Mel-koeffitsiyentini
olish
imkon
beradi.
Mel-koeffitsiyentlarining qiymatlari va tahlil qilingan chastota diapazoniga ega
bo‘lgan holda, bunday filtrlar to‘plamini qurish mumkin. Mel-koeffitsiyentining
tartib raqami qancha ko‘p bo‘lsa, filtr poydevori shunchalik keng bo‘ladi.
Xomaki namunasi uchun diskretlash chastotasi 16 kGs bo‘lgan 24
chastota
diapazoni olinadi. Birinchi amplituda koeffitsiyenti - spektrning doimiy komponenti
e’tiborga olinmaydi, qolgan 255 spektral koeffitsiyent amplitudasi 24 uchburchak
filtrlar orqali o‘rtacha hisoblanadi. Ushbu diapazonlarning chastotalari 4.1-jadvalda
keltirilgan.
O‘rtacha vazn ma’lum bir filtr uchun quyi va yuqori chastotalar orasidagi
chastotalarga mos keladigan amplituda spektral koeffitsiyentlar uchun topiladi. Agar
amplituda polosasining markaziy chastotasiga to‘liq mos keladigan bo‘lsa, unda 1-
koeffitsiyentiga ko‘paytiriladi.
Amplituda qiymatiga mos keladigan chastotani o‘rtadan quyi yoki yuqori
chegaraga o‘tkazishda koeffitsiyent 1 dan nolga kamayadi. Amplitudalarning
67
koeffitsiyentlar bo‘yicha hosilalari yig‘ilib, amplituda qiymatlari soniga bo‘linadi.
Bu ma’lum bir chastota diapazoni uchun o‘rtacha og‘irlik.
4.1-jadval
Diapazon
Quyi
chastota (Gs)
O‘rta
chastota (Gs)
Yuqori
chastota (Gt)
Do'stlaringiz bilan baham: