Речевые кодеки для IP-телефонии
Особенности функционирования каналов для передачи сообщений, и прежде всего сети Интернет, а также возможные варианты построения системы телефонной связи на базе сети Интернет представляют ряд специфических требований к речевым кодекам (вокодерам). В случае пакетной передачи и коммутации речевых данных отпадает необходимость кодирования и синхронной передачи одинаковых по длительности фрагментов речи. Наиболее целеобразным и естественным для системы IP-телефонии является применение кодеков с переменной скоростью кодирования речевого сигнала. В основе кодека речи с переменной скоростью лежит классификатор входного сигнала, определяющий степень его информативности и, таким образом, задающий метод кодирования и скорость передачи речевых данных. Наиболее простым классификатором речевого сигнала является детектор голосовой активности (VAD), которые выделяют во внешнем речевом сигнале активную речь и паузу. При этом фрагменты сигнала, отнесенные к активной речи, кодируются некоторыми известными алгоритмами (по правилу метода Code Excited Linear Prediction — CELP) с характерной скоростью 4–8 Кбит/с. . Фрагменты, классифицированные как паузы, кодируются и передаются с очень низкой скоростью (порядка 0,1–0,2 Кбит/с), либо не передаются вообще. Передача минимальной информации о паузных фрагментах предпочтительна. кодируются и передаются с очень низкой скоростью (порядка 0,1–0,2 Кбит/с), либо не передаются вообще. Передача минимальной информации о паузных фрагментах предпочтительна. кодируются и передаются с очень низкой скоростью (порядка 0,1–0,2 Кбит/с), либо не передаются вообще. Передача минимальной информации о паузных фрагментах предпочтительна.
Схемы более эффективныx классификаторов вxодного сигнала детальнее осуществляют классификацию фрагментов, соответствующиx активной речи. Это позволяет оптимизировать выбор стратегии кодирования (скорости передачи данных), выделяя для особо ответственных за качество участников речевого сигнала большее число бит (соответственно большую скорость), для менее ответственных - меньше бит (менее бит). При построении кодеков можно добиться низких средних скоростей (2–4 Кбит/с) при высоком качестве синтезируемой речи.
Необходимо отметить, что для рассматриваемых применений традиционная для вокодеров проблема снятия задержки при обработке сигнала в кодеке не является актуальной, так как величина суммарной задержки при передаче речи в резими определителей влаваджи Тем не менее, решения, позволяющие снять сделку в вокодере, представляют практический интерес.
Проведенный в различных выявлениях анализ синтезированной речи при передаче речевых данных через сеть Интернет показывает, что возникновение возникновения возникновения искажений, снижение качества и разборчивости данными. Гистограммы распределения число последовательно потерянных пакетов, показывают, что вероятность одинаковых потерь выше вероятности потери нескольких кадров подряд. Мойно ожидать, что с развитием сети Интернет при дальнейшем увеличении ее пропускной способности, оптимизации маршрутизаторов и протоколов преобладающую роль будут играть потери одиночных пакетов. Следует заметить, что в случае цена пакета данные, как правило, доставляются без ошибок.
Таким образом, одной из вайнейших задач при построении вокодеров для IP-телефонии является создание алгоритмов сжатия речи толерантных к потерям пакетов.
Для обслуживания широкой сети абонентов системы IP-телефонной связи с применением шлюзов следует включать абонентские линии с аналоговыми соединениями. Это означает, что синтезированный сигнал в аналоговом речевом сигнале по присоединяемой линии будет подаваться на абонентское оборудование. Точно так же сигнал с выхода микрофонного телефонного аппарата абонента по аналоговой линии будет поступать на вход вокодера, размещенного в шлюзе. Хорошо известно, что классические алгоритмы низкоскоростной компрессии чувствительны к амплитудно-частотным искажениям, возможным в комбинированных линиях и акустических трактах. При создании алгоритмов низкоскоростных словарей следует учитывать акушерство.
Насколько моено судить по литературным данным специальными разработками для Интернет-телефонии, рекомендованными МСЭ-Т (секс стандартизации в области телекоммуникаций международного союза телекоммуникаций) пока не существует. Среди международных стандартов, рекомендуемых для подобных систем, чаще всего упоминается G.723.1, обеспечивающий передачу речи со скоростью 5,3 и 6,3 Кбит/с, а также G.729 для скорости передачи 8 Кбит/с. Следует отметить, что упоминаемый в начале кодек glavax G.711 со скоростью передачи 64 Кбит/с следует использовать лишь в коммерческих сетях, когда, как правило, ресурсы канала не ограничены, поскольку данный кодек при научном использовании не используется.
Гарантируя достаточно высокое качество счета в идеальных условиях передачи, упомянутые стандартные разработки для использования в каналах, отличных от Интернета и уже позье частично адаптировались для условий потери пакетов. Разработка этих стандартов включает в себя все Voice Activity Detector в элементах, ответственных за синтез речевого сигнала на фрагментах, соответствующих потерянным речевым данным.
Do'stlaringiz bilan baham: |