Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
реферат_корсукова_итог.docx
Скачиваний:
6
Добавлен:
24.09.2019
Размер:
117.31 Кб
Скачать

Способы уменьшения психофизиологической избыточности

Уменьшение психофизиологической избыточности основано на учете особенностей слухового восприятия человека, и прежде всего — на частотной и временной маскировке, инерционности и делении на "критические полоски слуха". Так, в пределах каждой из 24 критических полосок слуха, образованных слуховым анализатором в диапазоне частот 20...20000 Гц, наибольшая по абсолютной величине спектральная составляющая маскирует рядом стоящие компоненты спектра, если ее уровень превышает некоторое пороговое значение, которое может быть найдено из кривых маскировки.

Большое значение имеет такое понятие, как порог слышимости, ниже которого акустические сигналы не воспринимаются. Величина порога слышимости не постоянна, она согласуется со звуковыми событиями и зависит, во-первых, от частоты и, во- вторых, от уровня других сигналов, на фоне которых воспринимается данный звук. Например, вследствие маскировки громкий звук может сделать неслышимым тихое звучание. При этом значение имеют формы спектров звуковых (речевых) сигналов, их уровни и временная последовательность. Важно и то, идет ли речь о тонах или звуках, имеющих широкополосные спектры. Достаточно полно исследовано, как изменяется (сдвигается) временно порог слышимости одного сигнала в присутствии другого, как тон и шум делают неслышимым звучание в соседних частотных полосах диапазона слышимых частот), и как громкое звуковое событие маскирует восприятие более тихих звуков, которые начинаются  раньше, т.е. опережают сигнал высокого уровня на интервал времени 30...20 мс (явление предмаскировки), или позже, т.е, запаздывают по времени на 0...120 мс (явление послемаскировки). Если известно, какие доли (части) звукового сигнала ухо воспринимает, а какие нет вследствие явления маскировки, то нужно вычленить и затем передать по каналу связи лишь те части сигнала, которые ухо способно воспринять, а неслышимые составляющие сигнала можно отбросить.

Кроме того, сигналы можно квантовать с возможно меньшим разрешением так, чтобы шумы квантования, изменяясь по величине с изменением уровня самого сигнала, еще не становились бы слышимыми. Учет всех этих свойств слуха и связанных с ним особенностей восприятия позволяет многократно сократить общее число бит, требуемое для цифрового представления звукового сигнала, т.е. сократить то количество информации, которое необходимо передать или запомнить, без потери качества звучания.

При согласовании шума квантования с характеристиками слуха изменяется форма сигнала и ухудшается объективное качество звукового сигнала, оставаясь субъективно незаметным на слух. Наиболее перспективным здесь является представление звукового сигнала в частотной области, которое обладает целым рядом достоинств, поскольку известно, что в начальной стадии процесса восприятия слуховой анализатор человека осуществляет некоторый спектральный анализ. Как отмечалось выше, сокращение избыточности посредством представления звукового сигнала в частотной области реализуется через кодирование формы спектра, обеспечивающее наибольшую эффективность сжатия (К может достигать 11 — 12 и более) и допускающее одновременное использование ряда методов сокращения статистической избыточности звукового сигнала.

Кодирование во временной области. Эта группа методов оперирует с отсчетами звукового сигнала во временной области. Типичными представителями данной группы методов являются компандерные системы, позволяющие поддерживать отношение сигнал/шум кодирования на уровне 50...60 дБ, что обеспечивает маскировку шума кодирования. Наиболее распространенным в данном классе является метод кодирования %САМ (почти мгновенное компандирование), позволяющий передавать монофонический 3C со скоростью цифрового потока 323 кбит/с.

Другим представителем методов кодирования во временной области является ДИКМ, позволяющая учитывать при кодировании статистические свойства звукового сигнала, связанные с корреляцией между отсчетами. При этом кодированию подлежат не сами отсчеты звукового сигнала, а разности между текущими отсчетами и их предсказанными значениями на основе использования предшествующих отсчетов. В вырожденном случае предсказание осуществляется по одному предшествующему отсчету.

Если разностный сигнал кодируется одним двоичным разрядом, то ДИКМ вырождается в дельта- модуляцию (ДМ). В реализационном плане ДМ является наиболее простым методом кодирования звукового сигнала, так как не требует дорогостоящих многоразрядных АЦП и ЦАП. Однако для сохранения высокого качества при ДМ приходится устанавливать частоту дискретизации существенно выше номинального значения, принимаемого в ИКМ.

Таким образом, сжатие с сохранением объективного качества, возможное только при кодировании формы сигнала, характеризуется коэффициентом сжатия (компрессии) К = 2 — 5 (в зависимости от жанра фрагмента вещательного сигнала).

Кодирование в частотной области (спектральные  методы кодирования). Наибольшей эффективностью при кодировании высококачественных цифровых вещательных сигналов обладают спектральные методы. В общем виде процедура кодирования в частотной области включает две операции: спектральный анализ звукового сигнала и собственно кодирование спектра. Соответственно, процедура восстановления звукового сигнала включает операции декодирования спектральных составляющих и синтеза сигнала во временной области по его спектру. При этом выделяют два основных метода спектрального анализа-синтеза звукового сигнала.

Анализ-синтез гребенкой квадратурно- зеркальных полосовых фильтров. Спектр звукового сигнала разделяется на полосы частот (т.е. исходный сигнал преобразуется в многоканальный полосный), в каждом полосовом канале осуществляется уменьшение частоты дискретизации до величины, равной удвоенной полосе пропускания соответствующего фильтра. Кодированию подвергаются последовательности отсчетов полосовых сигналов. Для синтеза исходного звукового сигнала производится повышение частоты дискретизации полосовых сигналов до исходной величины и их суммирование. В идеале полосы фильтров должны соответствовать критическим полоскам человеческого слуха.

Анализ-синтез с помощью ортогональных преобразований предполагает разбиение последовательности отсчетов звукового сигнала на блоки. Над каждым блоком выполняется дискретное ортогональное преобразование. Для синтеза исходного звукового сигнала достаточно выполнить обратное ортогональное преобразование. В общем случае блоки отсчетов перекрываются и в местах перекрытия сглаживаются функцией "временного окна". Применение окон позволяет компенсировать эффект Гиббса и формировать спектр звукового сигнала с наибольшей концентрацией энергии в тех частотных диапазонах, где фактически присутствует сигнал. Размерность преобразования определяется требуемой разрешающей способностью по частоте. С точки зрения концентрации энергии спектра сигнала и учета физиологических особенностей слуха предпочтительными являются преобразования, базис которых образует гармонические сигналы: дискретные преобразования Фурье, косинусное и т. д.

Возможен комбинированные метод анализа-синтеза, сочетающий разделение спектра звукового сигнала на полосы частот с помощью гребенки цифровых фильтров и тонкий спектральный анализ в каждой полосе с помощью ортогонального преобразования. В данном методе, варьируя длину блока ортогонального преобразования и ширину полос фильтров, можно добиться переменной разрешающей способности по частоте, что хорошо согласуется с особенностями обработки звукового сигнала в слуховой системе человека.

Процедура кодирования спектральных составляющих включает два этапа: распределение бит, выделенных на кодирование спектральных составляющих так, чтобы ошибки кодирования наилучшим образом маскировались полезным сигналом и преобразование кода спектральных составляющих. При этом максимальный эффект достигается, если квантование сигнала производится адаптивно в соответствии с максимальным уровнем звукового сигнала в субполосе. Методы кодирования, основанные на использовании спектрального анализа-синтеза с помощью полосовых фильтров, называют (под)полосным кодированием. Наиболее яркими представителями методов подполосного кодирования являются метод MUSICAM, использующий гребенку из 32 полосовых фильтров, и метод SB — ADPCM, использующий гребенку из 8 фильтров и кодирование полосовых сигналов методом адаптивной ДИКМ.

Методы кодирования, использующие спектральный анализ - синтез с помощью ортогональных преобразований, называют кодированием с преобразованием. Типичными представителями этой группы являются адаптивное кодирование с дискретным косинусным и модифицированным дискретным косинусным преобразованиями — методы АТАС и ASPEC.