МЕТОДЫ ПЕРЕДАЧИ СИГНАЛОВ СТЕРЕОПАР В ЦИФРОВОМ ТВ
И.А.Гаврилов (доцент, ТУИТ им. Мухаммада аль-Хоразмий)
В настоящее время для организации вещания стереоскопического
(объемного) телевидения необходимо передавать сигналы изображений для
левого и правого глаза, называемых стереопарой. Поэтому одной из
основных задач стереоскопического телевидения является выбор способа
кодирования
и
передачи
объемных
изображений,
позволяющего
удовлетворить
двум
противоречивым
требованиям:
компактности
передаваемых данных и сохранения высокого качества, синтезируемых на
приемной стороне изображений. При этом существующие методы
кодирования и передачи сигналов объемного телевидения, можно разделить
94
на те, которые используют независимую передачу сигналов стереопары, и те,
которые опираются на свойство "похожести" двух кадров стереопары.
Для кодирования сигналов стереопар в системах цифрового ТВ могут
использоваться методы независимой передачи сигналов стереопар, передачи
изображений с учетом межкадровой корреляции стереопар и п
ередача
сигналов стереопары с формированием карты глубины в ф
ормате 2D+Z,
которые рассмотрим более подробно.
При независимой передаче сигналов стереопар сформированные
камерой два кадра стереопары кодируются и передаются независимо,
например, используя современный стандарт сжатия H.264/AVC (рис.1). В
этом случае транспортные потоки с выхода каждого кодера поступают на
мультиплексор, который создает групповой транспортный поток одной
стереоскопической программы.
Рис.1. Блок-схема независимой передачи сигналов стереопары
В этой схеме задача мультиплексора состоит не только в объединении
потоков, но и в формировании системной информации, указывающей
принадлежность двух потоков одной программе. При этом важным
обстоятельством системы объемного телевидения является ее совместимость
с обычным "плоским" телевидением. То есть, владельцы обычных
телевизионных приемников должны без искажений принимать объемную
программу в "плоском" виде. В данной системе совместимость
обеспечивается за счет декодирования на приемной стороне любого из двух
потоков. Данный метод характеризуется простотой реализации, однако
недостатком
этого
варианта
является
большая
избыточность
видеоинформации, поскольку два потока стереопары, незначительно
отличаются друг от друга, что порождает бинокулярную избыточность.
Для повышения эффективности кодирования может использоваться
корреляцию между левым и правым изображением. В этом случае
необходимо вычислить величины параллаксов соответствующих точек
изображения и на приемную сторону передать один из кадров стереопары
(для обеспечения совместимости с "плоским" телевидением) и информацию
об объеме, которая обычно значительно меньше исходного изображения.
Поэтому метод бинокулярной декорреляции стереопары наиболее
предпочтителен для систем вещательного телевидения, где эффективность
использования ограниченного частотного ресурса каналов связи имеет очень
важное значение. Причем, для более эффективного кодирования используют
методы компенсации параллакса, как это делается при компенсации
движения видеообъектов в смежных кадрах. Эта особенность позволяет
95
применить ДИКМ с компенсацией движения для устранения, как временной,
так и бинокулярной избыточности. Только в этом случае речь идет уже о
ДИКМ с компенсацией параллакса (рис.2).
В этом методе оценка параллакса может быть осуществлена
сопоставлением точек, фрагментов или объектов левого и правого
изображений. Однако, процедура нахождения параллакса требует
значительных
вычислительных
затрат,
поэтому
для
повышения
быстродействия оценки параллакса обычно применяют метод фазовой
корреляции параллактических сдвигов между кадрами стереопары, основу
которого составляет преобразование Фурье (ПФ). Данный подход позволяет
сократить время выполнения анализа и, снизить требования к
быстродействию кодирующих устройств. Кроме того, метод фазовой
корреляции обеспечивает нечувствительность к яркостным изменениям,
которые характерны для стереоскопических изображений, а также уменьшает
количество ошибок на изображениях периодических структур.
Рис.2. Передача стереопары с оценкой компенсации параллакса
Для обеспечения высокой реалистичности изображений трехмерного
мира на экране стереодисплея требуется многоракурсная съемка с большим
количеством камер. Однако, в этом случае
объем видеоданных возрастает
многократно. Поэтому для эффективного уменьшения объемов видеоданных
и совместимости систем обычного и объемного телевидения был разработан
специальный формат, называемый
2D+Z.
В этом формате любому обычному
плоскому (2D) изображению сопоставляют информацию об удаленности от
камеры каждого пикселя (Z-координату). Такое представление изображения
называют "формат 2D+Z", а плоскость координат Z – "картой глубины".
Карта глубины – это черно-белое изображение, которое по размеру
совпадает с изображениями стереопары, но уровнями яркости передающее
информацию о глубине объектов сцены. При этом удаленность по глубине от
камеры представлена
градациями серого. На таком изображении более
светлые области характеризуют близость объектов к камере, а более темные
– их удаленность.
Кодирование
стереоскопических
изображений,
представленных
согласно этому методу, может осуществляться в виде формирования двух
цифровых потоков (рис.3). Где один поток, для совместимости с
"двумерным" телевидением, содержит левую или правую видеопоследова-
96
тельность, а второй поток передает видеопоследовательность карт глубины.
А на приемной стороне происходит синтез второго кадра стереопары.
В настоящее время существуют телевизионные приемники, на вход
которых можно подавать декомпрессированные потоки одного из
изображений стереопары и карту глубин. А приемник восстанавливает
второй кадр стереопары и формирует трехмерное изображение, которое
можно наблюдать на безочковых автостереоскопических экранах.
Рис.3. Схема передачи сигналов стереопар с формированием карты глубины
Исследования показали, что применение формата 2D+Z увеличивает
объем данных не более чем на 20 %, по сравнению с обычным телевидением.
Что показывает его высокую эффективность.
Следует отметить, что формат MPEG-4AVC (H.264), позволяет
стандартным способом передавать и обычное 2D изображение, и
соответствующую ему карту глубины (Z). Эта карта кодируется как
дополнительные данные, которые игнорируются устройствами обычного
телевидения. При этом наличие плоскости Z никак не влияет на
декодирование основного изображения.
Do'stlaringiz bilan baham: |