Ўзбекистон республикаси ахборот технологиялари ва коммуникацияларини ривожлантириш вазирлиги муҳаммад ал-хоразмий номидаги



Download 7,66 Mb.
Pdf ko'rish
bet200/267
Sana25.02.2022
Hajmi7,66 Mb.
#300373
1   ...   196   197   198   199   200   201   202   203   ...   267
Bog'liq
туплам 21(06.04)

VAD
Извлечение 
признаков
Создание модели
Другие задачи, 
связанные с речью


422 
кадры имеют более низкую энергию, чем речевые кадры [4]. Поэтому 
энергия сигнала можно использовать как индикатор присутствия речи. Речь 
добавляет энергию к сигналу, так что высокоэнергетические области сигнала 
можно принимать как участками активной речи. Можно установить порог 
голос

таким образом, чтобы, когда энергия сигнала 
 
2
x

выше порогового 
значения, VAD указывал на речевую активность.
 
 
2
2
0,
( )
1,
голос
голос
x
VAD x
x







 


Для реализации данного подхода, применяется оконное управление к 
входному сигналу с окнами длиной 25 
мс
и 10 мс перекрытием. Пусть на 
текущем 
кадре 
наблюдается 
последовательность 
N
отсчетов 
1
2
,
,...,
,...,
.
k
N
x x
x
x
Для каждого окна вычисляется энергия сигнала с помощью 
следующей формулы: 
 
1
2
2
2
0
1
N
k
k
x
x
x
N






Обычно, принятия решения осуществляется на основе энергетического 
порога. Данный алгоритм является параметрическим, т.е. необходимо 
установить пороговый параметр вручную. Результаты для временного ряда 
при применении VAD на основе энергии (
пороговый параметр = 0.6

приведен на рисунке 2 [5].
Рис. 2. Временные ряды и результаты VAD на основе энергии 
Заключение.Обнаружение пауз в речи, который позволяет существенно 
повысить точность разделения на активные участки речи и паузы. При этом 
качество восстанавливаемой речи остается практически на том же уровне. 
В статье предлагается алгоритм обнаружения речевой активности на 
основе энергии. Определено, что выбор детектора речевой активности 
существенно влияет на результаты работы системы распознавания диктора и 
речи. Однако стоит заметить, что не существует алгоритма VAD, решающего 
наилучшим образом различные задачи. Дальнейшее направление исследо-
ваний –изучение поведения разработанного алгоритма в различных условиях. 
Литература 
1.
Kondoz A.M. Digital Speech. John Wiley & Sons, Ltd. 2004. – 442 p. 
2.
https://en.wikipedia.org/wiki/Voice_activity_detection 
3.
Homayoon Beigi, Fundamentals of Speaker Recognition, Springer, 2011 
4.
R.G.Bachu, S.Kopparthi, B.Adapa, B.D.Barkana, "Voiced/Unvoiced Decision for Speech 
Signals Based on Zero-Crossing Rate and Energy," 2010. 
5.
https://github.com/wiseman/py-webrtcvad 


423 

Download 7,66 Mb.

Do'stlaringiz bilan baham:
1   ...   196   197   198   199   200   201   202   203   ...   267




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish