Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Введение в компрессию формата MPEGAUDIO.doc
Скачиваний:
31
Добавлен:
01.05.2014
Размер:
1.75 Mб
Скачать

Введение в компрессию формата MPEG/AUDIO

Дэвис Пэн

Фирма Моторола

Этот материал опубликован с разрешения IEEE.Данное разрешение IEEEникаким образом не подтверждает каких либо продуктов или услуг фирм Motorolaи Digital.

Внутренне или персональное использование данного материала – разрешено.Однако разрешение к перепечатыванию или переизданию данного материала в рекламных или сопутствующих целях, или в целях создания коллективной работы для перепродажи или перераспределения должны быть получены у IEEEпо средствам отправки электронного письма на адрес: info.pub.permissions@ieee.org.

Если вы читаете этот документ, то вы согласны с перечисленным выше законом об авторском праве, защищающем этот документ.

Предисловие

Это введение затрагивает базовую теорию компрессии формата MPEG/audio.Данный алгоритм был разработан группой Motion Picture Exterts (MPEGroup)как стандарт ISOдля высокоточной компрессии цифрового звука. Стандарт MPEG/Audioявляется частью множества стандаров, предназначенных для для видео компрессии (11172-2), аудио компрессии (11172-3), и синхронизации аудио и видео и связанных с потоками данных (11172-1) укладывающихся в примерную норму 1.5 Мегабит/сек. Стандарт MPEG/Audioтак же может бють использован только для аудио приложений для компрессии высокой точности аудио данных с очень маленьким битовым коэффициентом (битрейтом).

Пока MPEG/AUDIOалгоритм компрессии неточен, что это обеспечивает транспарантность компрессии по 6 и более факторам. Работа алгоритма дает возможность расширять свойства аудиосистем, используемых человеком.

Этот документ также прояснит основы физической модели и методы, которыре используются алгоритмом компресси MPEG/Audioдля сжатия аудио данных с наименьшим существенным уменьшением.

Введение.

Это учебное пособие покажет основы MPEG/audioкомпрессии. Оно написано для людей с небольшими знаниями в области цифровых сигнальных процессов, и не требует серьезного опыта в аудио компрессии или физикоаккустике. Это возможность дать широкие предварительные понятия MPEG/audioкомпрессии. Некоторые детали опускаются. Насколько возможно в этом пособии используются схемы и иллюстрированные примеры для описания замысловатостей алгоритма.

Алгоритм MPEG/audio компрессии это первый интернациональный стандарт цифровой высокоточной аудио компрессии. Другий алгоритмы ацдио компрессии предназначены для голосовых приложений или предоставляют компрессию только средней точности производительности. К примеру CELP– алгоримт голосовой компрессии, также МЮ-закон и ADPCM –относительно простой алгоритм, который предоставляет среднюю точность аудио компрессии. Для простого представления сложности алгоритма MPEG/audioрассматривается основы алгоритмов компрессии, как приложение к данному материалу, рассматриваются детали МЮ-закона и ADPCалгоритма, адаптированного Интерактивной Мультимедийной ассоциацией.

MPEG/audio стандарт – это результат трех летней совместной работы интернациональных обьединенных экспертов в области высоко точной аудио компрессии, таких как Motion Picture Experts Group.Интернациональная организация сдандартизации и интернациональный электротехнический комитет (ISO/IEC)приняли этот стандарт в конце 1992 года.

Насмотря на то, что APEG/audioкомпрессия превосходно пригодна только для аудио приложений, она является часть трех снаднартов компрессии. Комбинация с двумя другими частями (аудио и видео) MPEGстандарт применим для компрессии синхронизированного видео и аудио в сумме составляющих битовый коэффициент около 1.5 Мегабит в секунду.

MPEG стандарт оправдан, только когда необходимо убедиться во взаимодействии. Это определяет синтаксис кодированного битового потока, определяя процесс декодирования, и требует согласованных тестов для оценки точности декодера. Это гарантирует, невзирая на оригинал, любую полностью совместимый MPEG/audioдекодер будет способен раскодировать любой MPEG/audioпоток данных с прдсказуемым результатом. Широкое применение этого стандарта позволит производителям предлагать и продавать большое количество MPEG/audioустройств по приемлемой цене.

Вероятно этот стандарт, открыт для будующих нововведений. Дизайнеры могут попробовать новые различные реализации кодеров и декодеров в пределах границ этого стандарта. Особенно это хорошая возможность для различий в декодеров.

MPEG/audio – особенности и применение.

MPEG/audio это общий стандарт аудио компрессии. Непохожий на голосовую модель кодирования, настроенную для голосовых сигналов, MPEG/audio дает компрессию независимых звуковых источников. Наоборот, кодировшик – расширяет пределы аудио систем, которыми пользуется человек. Плюсы результата компрессии от удаления от восприятия неуместных частей аудио сигналов. Удаление таковый частей результата в неслышных искажениях, таким образом MPEG/audio предлагает различный ассортимент режимов компрессии:

Норма аудио семплирования может быть - 32, 44.1, или 48кГц.

Упакованный поток данных может содержать один или два аудио канала в четырех различных режимах:

  1. Монопольном режиме – для одного аудио канала,

  2. двойном монопольном режиме для двух независимых аудио каналов ( функционально это идентично стерео режиму)

  3. стерео режим для стерео каналов с разделением битов между каналами, но не совместного стерео кодирования, и

  4. режим совместного стерео кодирования который,. В котором кажды пользуется корреляцию между стерео каналами, или не относящихся к фазам различия между каналами, одновременно.

Упакованный поток данных может иметь один из возможных фиксированных битрейтов в пределах от 32 до 224кГц, на канал. В зависимости от характеристик аудио сэмплирования, это дает уменьшение за счет компрессии в пределах от 2.7 до 24 раз. В совокупности стандарт дает “свободный” режим битрейта, для поддержки фиксированных битрейтов, отличных от описанных битрейтов.

MPEG/audio предлагает выбор одного из трех независымых слоев компрессии. Это дает широкий спектр коммерческих предложений независимых кодеров различной сложности и компрессированного аудио качества:

Слой первый: это простейший и наиболее подходящий для бит рейтов примерно равных 128 kbit/secна канал. К примеру Цифровая компакт кассета фирмы Philipsиспользует 1 уровень компрессии на бит рейте 192 kbit/secнп канал.

Слой второй: имеет промежуточную сложность и предназначен для битрейтов примерно равных 128kbit/sec на канал.Возможность применения этого слоя находится в кодировании для Цифровых аудио широковещаний, для накопления синхронизированных аудио и видео последовательностей на CD-ROMдисках, и полно возможных расширений интерактивных CD, видео CD/

Слой третий: самый сложный но дает лучшее аудио качество, особенно при битрейтах близких к 64kbit/sec на канал. Этот слой отлично подходит для передачи аудио через каналы ISDN.

Все три слоя довольно простые для реализации их на одном чипе, включающего осуществление декодирования в режиме реального времени.

Закодированные потоки данных поддерживают оптимальную Циклическую избыточную проверку определения ошибок. (CRC error).

MPEG/audio – предоставляет средства вставки вспомогательных данных внутри потока данных.

А так же MPEG/audio поток данных организован таким образом, что доступ можно получить к любой его части, к примеру для быстрой перемотки и воспроизведения в обратной последовательности.

Введение.

Основа MPEG/audio компрессии – это дескретизация. Хотя дескрктизация убыточна, этот алгоритм обеспечивает транспарантность, компрессии. MPEG/audio сопровождался многочисленными прислальными тестами прослушивания в течении разработки стандарта. Тесты показали, что четкое соотношение 6 к одному (стерео, 16бит/инструмент, аудио семплироване на 48кГц, компрессия 256кбайт/сек.) – оптимальное соотношение для прослушивания, профессиональные слушатели не могли отличить значительных различий между закодированным и оригинальным аудио клипом, одного и того же смысла. Кроме того эти клипы были выбраны потому, что они наиболее тяжелы для компрессии. Сноска 7 описывает детали параметров, ход и результаты тестов.

На рисунке 1 показаны блок диаграммы MPEG/audio кодера и декодера.

Входной аудио поток пропускается через блок фильтра, который разделяет входной сигнал на множественные части определенных частот. Входной аудио поток одновременно проходит через психоаккустическую модель, которая определяет отношение энергии сигнала к определенному критическому уровню для каждой составляющей. Блок звукового распределения использует отношение сигнала к уровню для определения того, как распределить суммарное число возможных битов кода для дескретизации каждой части для минимизациии слышимых частей дискретизированного звука. Конечный блок берет предоставленные дискретезированные части и форматирует эти данные и служебную информацию в закодированный поток данных. Вспомогательные данные необязательно связывать с аудио потоком. Декодер разбирает потом данных, восстанавливает значения дескретизированных частей, и перестраивает аудио сигнал из значений этих частей.

Следующие части рассказывают определенные аспекты MPEG/audio компрессии более детализированно. Первая часть рассказывает о о времени для частотного преобразования многофазового блока фильтра. Следующая часть описывает реализацию психоаккустической модели из которой выводится более детальное описание третьего слоя MPEG/audio компрессии. Это служит основой для сжатого изложения всевозможных процессов, которые используются тремя слоями методов кодирования стерео звуков.

Документ заканчивается кратким описанием работы существующих MPEG/audio стандартов.