11
Каждому элементарному акустическому звуку,
называемому
фонемой, соответствует определенная форма акустических резонато-
ров, обусловленная формой губ, зубов, размером гортани, положени-
ем языка и т.д. У людей индивидуальный голосовой аппарат и это да-
ет возможность идентифицировать речь конкретного человека.
Каждая фонема (звук речи) имеет характерное для нее распре-
деление энергии по частоте. В русском языке 44 фонемы. В диапазоне
звуковых частот есть несколько участков спектра, на которых более
высокий уровень спектральных
составляющих, чем на соседних час-
тотах. Эти участки спектра называются формантными, а частоты, со-
ответствующие максимальным – формантными частотами
F
k
(
k = 1, 2,
3, …). Наибольшее значение амплитуд называют амплитудами
формант
a
k
.
Речь иногда называют формантным рисунком и он индивидуа-
лен для различных языков и различных лиц. В русской речи обычно
наблюдаются от одной до шести формант.
Взаимное расположение формант, их число и частное размеще-
ние для одних и тех же звуков в различных
звукосочетаниях могут
значительно различаться. Однако взаимное расположение формант-
ных областей имеет в среднем определенное положение. Это дает
возможность распознавания речи с помощью ЭВМ. На рис. 5 приве-
дены кривые, характеризирующие форманты для нескольких муж-
ских голосов.
Рис. 5. Пример формант звука мужского голоса
Практически это плотность распределения
вероятностей нор-
мального распределения вокруг формантных частот. Под спектром
12
речи принято понимать зависимость среднего за длительный времен-
ной интервал уровня В
р
,
выраженного в децибелах, от
частоты f. То
есть это логарифмический энергетический спектр, что определяется
логарифмической шкалой чувствительности слуха человека.
Сосредоточенность спектра речи позволила ограничить спектр
телефонного сигнала частотами от 0,3 до 3,4 кГц и это международ-
ный стандарт на спектр телефонии. Английская речь по сравнению с
русской имеет более равномерный спектр в
диапазоне телефонного
канала. Китайская речь характерна сдвигом формант в более высокую
частотную область.
На рис. 6 приведено изменение характеристик русской речи и
параметров слуха в зависимости от частоты.
Рис. 6. Нормированный спектр речи и собственных
шумов слуха В
р
и порог слышимости
β
0
Do'stlaringiz bilan baham: