Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
БТВА (окончательная редакция) для печати.docx
Скачиваний:
1077
Добавлен:
09.02.2015
Размер:
3.99 Mб
Скачать

10.6. Компенсация движения и дискретно-косинусное преобразование

Эффективное сжатие видеоинформации основано на двух основных идеях: подавление несущественных для визуального восприятия мелких деталей пространственного распределения отдельных кадров и устранения временной избыточности в последовательности этих кадров. Соответственно говорят о пространственной и временной компрессии.

Пространственная компрессия использует экспериментально установленную малую чувствительность человеческого восприятия к искажениям мелких деталей изображения. Глаз быстрее замечает неоднородность равномерного фона, чем искривление тонкой границы или изменение яркости и цвета малого участка. Из математики известно два эквивалентных представления изображения: привычное человеку пространственное распределение яркости и цвета и так называемое частотное распределение, связанное с пространственным дискретно-косинусным преобразованием (ДКП). Теоретически они равнозначны и обратимы, но сохраняют информацию о структуре изображения совершенно по-разному: передачу плавных изменений фона обеспечивают низкочастотные (центральные) значения частотного распределения, а за мелкие детали пространственного распределения «отвечают» высокочастотные коэффициенты. Это позволяет использовать следующий алгоритм сжатия. Кадр разбивается на макроблоки размером 16х16 (размеру 720х576 соответствует 45х36 макроблоков в кадре), каждый из которых ДКП переводит в частотную область. Затем соответствующие частотные коэффициенты подвергаются квантованию (округлению значений с задаваемым интервалом). Если само по себе ДКП не приводит к потере данных, то квантование коэффициентов, очевидно, вызывает огрубление изображения. Операция квантования выполняется с переменным интервалом – наиболее точно передаётся низкочастотная информация, в то время как многие высокочастотные коэффициенты принимают нулевые значения. Это обеспечивает значительное сжатие потока данных, но приводит к снижению эффективного разрешения и возможному появлению незначительных ложных деталей (в частности, на границе блоков). Очевидно, что чем более грубое квантование используется, тем больше степень сжатия, но и тем ниже качество результирующего сигнала.

Временная компрессия использует высокую избыточность информации в изображениях, разделённых малым интервалом. Действительно, между смежными изображениями обычно меняется только малая часть сцены – например, происходит плавное смещение небольшого объекта на фоне фиксированного заднего плана. В этом случае полную информацию о сцене нужно сохранять выборочно – только для опорных изображений. Для остальных достаточно передавать только разностную информацию: о положении объекта, направлении и величине его смещения, о новых элементах фона (открывающихся за объектом по мере его движения). Причём, эту разностную информацию можно формировать не только по сравнению с предыдущими изображениями, но и с последующими (поскольку именно в них по мере движения объекта открывается часть фона, ранее скрытая за объектом). Математически наиболее сложным элементом является поиск смещающихся, но мало изменяющихся по структуре макроблоков (16х16) и определение соответствующих векторов их смещения. Однако это элемент наиболее существенен, так как позволяет существенно уменьшить объём требуемой информации. Именно эффективностью выполнения этого "интеллектуального" элемента в реальном времени и отличаются различные MPEG-кодеры.