Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпорки.docx
Скачиваний:
13
Добавлен:
24.09.2019
Размер:
500.38 Кб
Скачать

16. Цветовые пространства: rgb, yCbCr; форматы сэмплир. YCbCr.

Метод, выбранный для представления яркости (или светимости) и цвета, называется цветовым пространством.

RGB. Захват изображения RGB основан на фильтровании красной, зеленой и голубой компонент видеосцены и их фиксировании с помощью отдельных сенсорных матриц. Цветные электроннолучевые трубки и жидкокристаллические дисплеи отображают изображения, отдельно освещая красные, зеленые и голубые компоненты каждого пикселя в соответствии с интенсивностью каждого из них.

YCbCr. Органы зрения человека менее чувствительны к цвету предметов, чем к их яркости. В RGB все три цвета считаются одинаково важными, они обычно сохраняются с одинаковым разрешением.

YCbCr и его вариации (иногда их обозначают YUV) является методом эффективного представления цветных изображений. Информация о цвете и информация о светимости отделены. Буква Y обозначает компоненту светимость, которая вычисляется как взвешенное усреднение компонент R, G и В по формуле: Y=kr*R+ kg*G+ kb. K-соответствующий цветовой множитель.

Цветовая информация может быть представлена компонентами цветовых разностей : Cb=B-Y, Cr=R-Y, Cg=G-Y.

В YCbCr используется компонента яркости (Y) и две хроматические компоненты (Сb, Сr).Преимущество YCbCr в том, что компоненты Сb и Сr можно представлять с меньшим разрешением, чем Y, так как глаз человека менее чувствителен к цвету предметов, чем к их яркости.

Отснятое RGB-изображение легко конвертировать в YCbCr для уменьшения объема сохраняемых или передаваемых данных. Однако перед тем, как отображать картинку на экране, необходимо сделать обратную конвертацию YCbCr в RGB. Это делается так:

Форматы сэмплирования YCbCr

Формат 4:4:4 подразумевает, что все три компоненты (Y, Сb и Сr) имеют одинаковое разрешение и, следовательно, сэмплы всех компонентов присутствуют в каждом пикселе. Число в пропорции означает относительную долю каждой компоненты при сэмплировании в горизонтальном направлении. Сэмплирование по формату 4:4:4 означает полную точность в передаче хроматических компонент.

По формуле 4:2:2 (числа 4:2:2 означают, что на каждые четыре сэмпла яркости Y по горизонтали отбирается только две компоненты Сb и две компоненты Сr). Формат 4:2:2 используется для высококачественного цветного видео.

В формате 4:2:0 каждая компонента Сb и Сr имеет и по вертикали и по горизонтали половину разрешения по сравнению с Y. Цветное сэмплирование 4:2:0 широко используется во многих потребительских приложениях, таких как видеоконференции, цифровое телевидение и диски DVD.

14. Энтропийный кодер. Коды с предсказанием. Коды переменной длины. Арифметическое кодирование.

Энтропийный кодер преобразовывает последовательности символов, представляющих элементы видеопоследовательности, в сжатый поток битов. Входные символы могут включать квантованные коэффициенты преобразования, векторы движения (корд. векторов перемещения всех блоков с компенсацией движения с целым или дробным пиксельным разрешением), маркеры (коды, обозначающие точки синхронизации в видеопоследовательности), хедеры (заголовки макроблоков, изобр., последовательностей) и дополнительную информацию («посторонние» данные, несущественные для корректного декодирования).

Коды с предсказанием. Многие близко расположенные точки изображений являются сильно коррелированными. Можно повысить эффективность кодирования с помощью предсказания элементов текущего блока по ранее декодированным данным, кодируя разность между предсказанным и фактическим значением этого элемента.

Вектор движения блока обозначает смещение на предсказанную ссылку ранее декодированного кадра. Векторы соседних блоков часто зависимы, так как движение объекта в кадре может захватывать большие участки изображения.

Параметр квантования(шаг квантователя) контролир. соотношение между эффективностью сжатия и качеством декодированного изображения. В видеокодеке, работающем в масштабе реального времени, может потребоваться модифицировать квантование в процессе кодирования кадра (например, чтобы изменить степень сжатия в целях подгонки битовой скорости кодированного потока к пропускной способности данного канала). Для этого бывает достаточно изменить этот параметр лишь для некоторых последовательных макроблоков. Новые параметры квантования необходимо сообщить декодеру, но вместо передачи новой величины предпочтительнее передать величину разности между новым и старым параметрами, которую декодер добавит к старому значению.

Коды переменной длины (VLC). Метод кодирования переменной длины сопоставляет потоку входных символов определенную последовательность кодовых слов различной длины. Символы, встречающиеся чаще, представляются более короткими словами VLC, а редко встречающиеся символы – длинными. Коды Хаффмана: находится вероятность появления каждого символа, строится дерево вероятностей, по которому строится множество кодовых слов переменной длины. Серьезным недостатком кодов, построенных на основе схемы Хаффмана, является их чувствительность к ошибкам. Искажение в одном бите последовательности этих кодов может привести к полной потери синхронизации при декодировании.

При переменном кодир. символам приписываются фиксированные кодовые слова, имеющие целую длину бит, но число бит, обеспечивающее наилучший теоретический результат, зависит от информационной емкости, которая часто бывает нецелым числом. Арифметическое кодирование является эффективной альтернативой кодам Хаффмана. С их помощью можно плотнее приблизиться к теоретически наилучшим границам сжатия статистических данных.

Арифметический кодер преобразует исходную последовательность символов в единственное действительное число, которое приближается к теоретическому оптимальному нецелому числу бит, необходимому для представления каждого символа последовательности.

Принципиальное преимущество метода арифметического кодирования заключается в том, что передаваемое кодовое число, не ограничивается заданием целого числа битов для каждого отдельного символа кодируемой последовательности.

Схема кодирования, в которой используется целое число бит для каждого символа сжимаемой последовательности (например, кодирование Хаффмана), неспособна приблизиться к оптимальному числу бит, поэтому арифметическое кодирование превосходит по эффективности компрессии кодирование Хаффмана.

Эффективность энтропийного кодирования зависит от точности моделей вероятностей символов. Контекстное арифметическое кодирование (CAE) основано на изучении локальных пространственных или временных вероятностных характеристик кодируемых последовательностей. Метод CAE используется в стандарте JBIG для сжатия бинарных изображений. Он был также приспособлен для кодирования двоичных "шаблонов» в MPEG-4 Visual и при кодировании основного профиля в стандарте Н.264.