Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
диплом_выгорко.docx
Скачиваний:
176
Добавлен:
16.04.2015
Размер:
893.79 Кб
Скачать

1.3 Режимы кодирования:

Опции кодирования источника в системе DRM показаны на рис. 1.

Рис. 1. Обзор кодирования источника

Система DRM предлагает звуковое (AAC) и речевое (CELP и HVXC) кодирование. В дополнение к этому, может быть использован метод реконструкции высокочастотной части спектра (SBR), чтобы улучшить качество субъективного восприятия для всех трех различных методов кодирования. Особенностью является то, что кодированный звуковой сигнал может быть помещен в звуковой суперкадр постоянной длины.

1.3.1 Кодирование звука по стандарту AAC:

Для кодирования звуковых сигналов используется технология AAC (Advanced Audio Coding, улучшенное звуковое кодирование), являющаяся подмножеством MPEG-4, которая выбрана с целью наилучшего удовлетворения системным возможностям DRM. К примеру, стандартной конфигурацией для одного КВ-канала должен быть режим моно со скоростью передачи данных 20 кбит/с.

Специфическими чертами AAC-потока в DRM являются следующие:

  1. Скорость передачи данных. Технология AAC может быть использована при любой скорости. Однако выравнивание числа байт в 400-милисекундном звуковом суперкадре приводит к дискретности значений скорости передачи с кратностью 20 бит/с.

  2. Частота дискретизации. Допустимыми значениями являются 12 кГц и 24 кГц.

  3. Длина преобразования. Длина преобразования составляет 960 с целью обеспечить соответствие во времени с 80-милисекундным или 40-милисекундным звуковым кадром. Такое требование необходимо для того чтобы привести в соответствие длины для CELP- и AAC-кадров, что в конечном счете, позволяет комбинировать целое число звуковых кадров при построении звукового суперкадра, длительностью 400 мс.

  4. Организация суперкадров. 5 (при fd = 12 кГц) или 10 (при fd = 24 кГц) звуковых кадров объединяются в 1 суперкадр, который всегда во времени соответствует длительности 400 мс. Кадры в суперкадре кодируются совместно таким образом, что любой суперкадр имеет постоянную длину, т.е. обмен бит между кадрами возможен только в границах суперкадра. Один суперкадр всегда размещается в одном логическом кадре. В этом случае нет необходимости в дополнительной синхронизации при звуковом кодировании. Привязка к границам кадра и информация для кодирования также представлена в суперкадре.

  5. Неравномерная защита от ошибок (UEP, Unequal Error Protection). Применение UEP в кодированном звуковом потоке достигается приемлемое ухудшение вероятности ошибок. Механизм UEP реализован в модулях мультиплексирования и кодирования.

1.3.2 Кодирование звука по стандарту MPEG CELP:

В системе DRM предложено речевое кодирование по стандарту MPEG CELP с целью достижения приемлемого качества речи при значениях битовой скорости, существенно меньших стандартного (например, “половинного” значения 8 кбит/с). Возможными сценариями для использования такого речевого кодера являются следующие:

  1. двойные/тройные речевые приложения: взамен одной звуковой программы со скоростью от 20 кбит/с до 24 кбит/с по каналу могут передаваться 2 или 3 речевых сигналов с возможностью их совместной передачи;

  2. передача речевых услуг в дополнение к звуковым услугам;

  3. совместная передача: в случае совместного аналогово/цифрового вещания возможны только скорости ниже 8 кбит/с;

  4. очень устойчивые к помехам речевые приложения: ожидается, что такой кодер, исходя из своей природы, может предложить более высокую устойчивость по отношению к канальным ошибкам;

Основные черты кодирования по стандарту MPEG CELP следующие:

  1. частота дискретизации 8 кГц или 16 кГц;

  2. скорость передачи от 4 до 20 кбит/с;

  3. устойчивость к ошибкам;

  4. возможность построения нескольких целых звуковых кадров а один звуковой суперкадр.

1.3.3 Кодирование звука по стандарту MPEG HVXC:

В системе DRM предложено речевое кодирование по стандарту MPEG-4 HVXC с целью достижения приемлемого качества речи при очень низких скоростях, таких как 2 кбит/с. Рабочие скорости HVXC делают доступными новые приложения DRM, такие как:

  1. частота дискретизации 8 кГц;

  2. скорости 2 и 4 кбит/с при фиксированной кодовой скорости;

  3. временная шкала и пошаговая модификация произвольного вида;

  4. поддержка синтаксиса, устойчивого к ошибкам, а также могут быть использованы механизмы контрольных сумм с целью улучшения эластичности потока HVXC в каналах, подверженных ошибкам;

  5. композиция некоторого постоянного числа (20) HVXC-кадров в один звуковой суперкадр.

1.4 Репродуцирование спектрального диапазона:

Чтобы поддержать приемлемое субъективное качество восприятия звука при низких скоростях классические алгоритмы сжатия звука или речи нуждаются в ограничении полосы частот и оперировании с низкой частотой дискретизации. Также желательно предложить широкую полосу частот при наличии очень низкой скорости. Это может быть реализовано путем использования механизма SBR репродуцирования спектрального диапазона.

Целью SBR является восстановление отсутствующей высокочастотной части спектра звукового сигнала, которую не хотелось бы подвергать кодированию. Для достижения этой цели необходимо передать в звуковом потоке некоторую дополнительную информацию, скорость которой составляющую малую процентную часть от общего значения скорости звукового кодера. Такая дополнительная информация вычисляется на основе сигнала в полной полосе до процесса кодирования и поддерживает реконструкцию высокочастотной части после звукового/речевого кодирования.

Технология SBR существует в двух версиях: метод SBR-LC с низкой сложностью, приводящий к среднему качеству звука, и метод SBR-HQ, дающий качество гораздо лучшее, по сравнению с SBR-LC, зато с гораздо большей сложностью. Обе версии являются совместимыми с точки зрения кодера и потока данных и, следовательно, приводят к концепции возможного обновления в будущем. Различаются версии только в деталях, отраженных в декодере.