Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

акустика лекции / Лекция 21.СОВРЕМЕННЫЕ СИСТЕМЫ

.doc
Скачиваний:
148
Добавлен:
20.02.2016
Размер:
887.81 Кб
Скачать

Рис. 7. Функциональная схема активного декодера Dolby Surround

Для примера возьмем случай, когда источник звука - единственный, и он расположен непосредственно у микрофона центрального канала С. Из рисунка видно, что пассивный декодер передаст сигнал центрального канала в выходной канал С, а также и в каналы R и L с ослаблением всего 3 дБ. Управляющая цепь активного декодера определяет, в каких каналах необходимо уменьшить усиление, чтобы подавить проникающие сигналы соседних каналов до необходимого уровня. В данном примере декодеру необходимо уменьшить усиление в каналах L и R, оставив слышимым сигнал канала С. Таким же образом можно развязать выход левого канала, уменьшив усиление в каналах С и S, когда на входе декодера присутствует только сигнал Lt. Фактически, сигнал может приходить с любого направления.

Таким "прямым" методом проблема решается только для единственного звукового образа. Саундтрек содержит звуки нескольких независимых источников. Рассмотрим случай, когда речь звучит на фоне музыки. Музыка должна воспроизводиться акустическими системами левого и правого каналов, а речь - только системой центрального канала. Пассивный декодер с такой задачей не справится вообще. Речь будет воспроизводиться как системой центрального канала, так и системами левого и правого каналов. Стереофоническая музыка будет воспроизводиться системами L и R, кроме того, суммарный сигнал L+R будет прослушиваться через систему С, а разностный L-R - через систему S.

Активный декодер считает речь доминирующим звуковым образом (dominant sound), и уменьшает усиление каналов L и R, чтобы сфокусировать этот образ в направлении С. Но при этом теряется стереофоническая музыка, остается только монофонический звук суммы (L+R) в канале С и "фантомный" звук разности (L-R) в канале S. Если говорящие герои замолкают, декодер восстанавливает усиление каналов L и R, и музыка становится слышимой и наоборот, при возобновлении речи музыка пропадает. Такое явление "качания" (pumping) мощности не доминирующих звуковых образов в зависимости от мощности доминирующего хорошо ощутимо.

Другой способ избавиться от проникновения речевого сигнала в левый и правый каналы показан на рис. 8. Если взять сигнал правого канала, инвертировать его полярность и сложить с выходным сигналом левого канала - компоненты сигнала С в левом и правом каналах окажутся противофазными и взаимно компенсируются, таким образом, в канал L компоненты сигнала С не попадут.

Принцип взаимной компенсации (cancellation concept) - основной принцип активного декодирования и в том или ином виде используется во всех активных декодерах.

Рис. 8. Предотвращение проникновения речевого сигнала

в левый и правый канал

После исключения сигнала центрального мощность звука в левом канале не уменьшается, часть сигнала левого канала заменяется инвертированным сигналом правого канала. Кроме того, в центральном канале по-прежнему прослушивается суммарный сигнал L+R. В результате доминирующий звуковой образ (речь в канале С) фокусируется в направлении акустической системы С, а образы, соответствующие направлениям R и L, наоборот, "размазываются" в пространстве. Декодером используется один из принципов психоакустики, принцип маскирования (signal masking concept): воздействие доминирующего звукового образа временно снижает способность слушателя определять направления на другие звуковые образы. Так как мощность звуков, соответствующих этим образам, остается неизменной, "качание" (модуляция) этих звуков не наблюдается. В этом заключается другой принцип психоакустики - принцип постоянства мощности (constant-power concept). Выполняя принцип постоянства мощности в сочетании с активной взаимной компенсацией только в те моменты, когда требуется передача точного направления на звуковой образ, можно эффективно скрыть факт перераспределения мощности не доминирующих звуков.

Предполагается, что громкость речи намного выше громкости музыки, поэтому сигнал речи используется, как управляющий, сигнал музыки - как управляемый. В реальности разница уровней подобных сигналов может быть менее значительной. Если два разных звука близки по уровню, один из них становится маскирующим для компонентов другого, попавших не в "свои" каналы и наоборот, и требования к степени развязки снижаются. В таком случае требуется меньшая степень активной компенсации, и, соответственно, меньшая степень перераспределения не доминирующих сигналов по направлению.

Иногда желательно вообще исключить регулировку усиления, сделав декодер "пассивным". Например, звуки дождя или ветра воспринимаются слушателем на подсознательном уровне. Они не связываются с конкретным источником и могут воспроизводиться всеми громкоговорителями одновременно. В этом случае не требуется пространственной фокусировки звука, следовательно, и активного декодирования.

Крайний случай: два или более звуковых образа присутствуют одновременно на разных направлениях и имеют примерно одинаковую мощность. В этом случае способность слушателя к определению направления на образы притупляется, поэтому технику компенсации можно не использовать или использовать не в полной мере.

Чтобы обеспечить эффективное декодирование для обоих случаев, декодер Pro Logic автоматически выбирает один из режимов декодирования, "быстрый" или "медленный". "Быстрый" режим используется, если доминирующий звуковой образ намного мощнее других образов. Если такие образы возникают на разных направлениях последовательно во времени, декодер должен последовательно воспроизвести их на соответствующих направлениях. В "медленном" режиме декодер отслеживает изменения входных сигналов с большей задержкой. В таких условиях маскирование проявляется слабо, поэтому, если декодер продолжит работу в "быстром" режиме, модуляция мощности не доминирующих образов станет заметной.

По определению, в каждый момент времени может существовать только один доминирующий образ, и ему соответствует единственное направление. Декодеру необходимо в любой момент времени иметь информацию о точном направлении на доминирующий образ, независимо от того, как быстро меняется пространственная звуковая картинка. Анализируя две пары электрических сигналов, соответствующих ортогональным осям декодера (левый-правый каналы, центральный канал-surround) можно однозначно идентифицировать любое направление в пространстве.

Рис. 9. Активный декодер Dolby Surround Pro Logic

Основой декодера Pro Logic является адаптивная матрица Pro Logic. В адаптивной матрице существуют два параллельных канала: канал прохождения входных сигналов Lt и Rt к суммирующей цепи и сложный канал управления. Большая часть электронных компонентов декодера используются для анализа входных сигналов и генерации сигналов управления, и относительно небольшая их часть занята собственно в обработке сигнала.

Главная задача управляющей цепи - определить параметры вектора доминирующего звукового образа. Сначала входные сигналы декодера нормируются, чтобы исключить ошибки, связанные с различием характеристик каналов передачи. Полосовой фильтр отсекает низкочастотные составляющие, не несущие информацию о направлении, и высокочастотные составляющие, и фазы которых сильно зависят от фазовых характеристик физических каналов.

Декодер Dolby Surround Pro Logic - П.

Pro Logic II - активный декодер Dolby Surround следующего поколения. Он также использует пространственную фокусировку, но реализован принципиально другими методами. Новый декодер получился намного проще и при этом эффективнее.

Задача декодера - предотвратить проникновение сигналов L и R в канал S, независимо от того, где находится источник сигнала - точно между микрофонами L и R, смещен от центра в ту или иную сторону или вообще находится непосредственно рядом с микрофоном одного из каналов. Например, если герои ведут диалог между микрофонами каналов R и С (права от центра), то уровень сигнала в каналах С и R будет одинаковым. В этом случае часть сигнала неизбежно проникнет на выход S пассивного декодера, так как уровень в канале L ниже, чем в канале R, и при вычитании одного сигнала из другого результат не будет нулевым.

Чтобы полностью компенсировать сигналы L и К на входах декодера surround, необходимо перед подачей на сумматор выровнять их уровни. Для этого между входами Lt и Rt и входами сумматора устанавливаются два регулируемых усилителя (VCA). Усиление VCA двух каналов изменяется одним и тем же управляющим сигналом, но в разной полярности. Если увеличивается усиление одного VCA, усиление второго уменьшается. Если такую регулировку осуществлять достаточно точно и достаточно синхронно с изменениями самого сигнала, можно полностью подавить разностный сигнал каналов Lt и Rt в канале Surround.

Рис. 10. Декодер Dolby Surround Pro Logic - П.

Чтобы автоматически отследить изменения входных сигналов, используется специальная цепь отрицательной обратной связи (feedback servo circuit). Выходные сигналы обоих VCA поступают на амплитудные детекторы (Full-Wave Rectifier, FWR), которые выделяют огибающую звуковых сигналов. Сигналы постоянного тока, пропорциональные амплитудам сигналов L и R, сравниваются дифференциальным усилителем. Сигнал с выхода усилителя, пропорциональный разности амплитуд, используется для управления VCA. Ha рисунке 10 показана только одна ось декодера (ось "левый -правый"). Вторая пара VCA с такой же управляющей цепью выравнивает уровни сигналов суммы L+R (фронтальный) и разности L-R (тыловой) для подавления сигналов С и S в каналах R и L (ось "центр - surround"). Сигнал центрального канала С получается сложением (вместо вычитания) двух сигналов Lt и Rt, выровненных по уровню усилителями VCA. Благодаря использованию управляющих цепей с обратными связями, декодер Pro Logic II приобрел следующие преимущества:

Простыми и дешевыми аппаратными средствами достигается более эффективная компенсация противофазных сигналов в выходной матрице, и, как результат, высокая степень развязки между каналами разных осей.

В декодере Pro Logic обе оси контролируются единой переключающей цепью "быстро/медленно". Если хотя бы по одной оси существует значительное доминирование, переключающая цепь переводит обе оси в "быстрый" режим, принудительно изменяя постоянную времени управляющих цепей VCA. Только при условии, что в обеих осях амплитуды сигналов примерно одинаковы, обе они переходят в "медленный" режим. В декодере Pro Logic II две оси функционируют независимо друг от друга, поэтому их управляющие цепи сами "решают", насколько быстро необходимо изменять усиление VCA, анализируя только собственные сигналы. Кроме того, постоянная времени управляющей цепи в декодерах Pro Logic II изменяется непрерывно, тогда как в Pro Logic предусмотрено только два фиксированных значения.

Рис. 11. Декодер Dolby Surround Pro Logic - П.

Декодер Pro Logic II может быть использован как универсальный декодер не только для фильмов, но и для других звуковых записей в Dolby Surround. Он идеально подходит для простой и недорогой бытовой аппаратуры. Именно поэтому в декодер Pro Logic II, кроме "штатного" режима Movie, был добавлен "пользовательский" режимы работы - Music.

Известно, что характеристики звука на саундтреках фильмов и на музыкальных записях отличаются. Главное отличие в том, что саундтрек пишется на калиброванной аппаратуре Dolby, поэтому при прослушивании через калиброванный декодер точность воспроизведения гарантируется. При записи музыки, как правило, не используется аппаратура Dolby Surround, поэтому невозможно предугадать, как конкретная запись будет воспроизводиться декодером. Поэтому режим Movie декодера Pro Logic II имеет фиксированные параметры, а режим Music, напротив, предполагает несколько настроек пользователя. Эти настройки могут быть использованы в любой аппаратуре с декодером Pro Logic II, но особенно они актуальны в автомобильной акустике, где положение акустических систем фиксировано, а положение "основного" слушателя может изменяться.

Регулировка глубины. Позволяет виртуально перемещать положение слушателя в направлении фронт-тыл. С помощью этой настройки можно добиться оптимального баланса между фронтальными каналами и surround для каждой музыкальной записи.

Регулировка положения центра и ширины стереобазы. С помощью этой настройки пользователь может сконфигурировать декодер таким образом, что звук, соответствующий центральному положению звукового образа, будет прослушиваться только в акустической системе центрального канала, только в системах левого и правого каналов (виртуальный центральный канал) или во всех трех системах с любой комбинацией уровней. Таким образом можно изменять баланс трех фронтальных каналов для оптимального прослушивания, например, водителем и пассажиром автомобиля. В домашней системе можно таким изменять ширину стереобазы - расстояния между акустическими системами фронтальных каналов, не перемещая сами системы.

Режим панорамы. В этом режиме создается впечатление "звучания со всех сторон сразу". Такой эффект достигается использованием естественного отражения акустической энергии систем surround от боковых стен помещения.

Dolby Digital АС-3

Dolby Digital АС-Зили как его еще называют Dolby Digital 5.1 появился в конце 80-х и был разработан для 35-мм пленки. С приходом этого стандарта нас ожидало несколько новшеств. Во-первых, был разработан шестиканальный стандарт, в котором появилась возможность использования сабвуфера, или как его еще называют LFE-channel (Low Frequency Effect). Во-вторых, S-канал перестал быть моно. То есть, в системе 5.1 мы имеем в наличии SL и SR- каналы (Surround Left и Surround Right). Громкоговорители всех каналов кроме LFE являются широкополосными. Впервые стандарт предложил возможности сжатия динамического диапазона. При этом стандарт АС-3 предусматривает компрессию данных. Сейчас скорость цифрового потока аудиоданных Dolby Digital составляет 320 кбит/сек и больше. Главная особенность Dolby Digital AC-3 - это его масштабируемость (рис.12).

Рис. 12. Масштабирование Dolby Surround 5.1.

Например, мы написали музыку в стандарте 5.1. При этом пользователь может ее прослушать без потерь в качестве в 5.1 (5.0), четырехканальном варианте Pro Logic, в обыкновенном стерео и даже в моно. И теперь представьте как это выгодно и пользователям и производителям. Компьютерные и видео-игры нового поколения само собой подразумевают наличие звука 5.1. При этом, пользователи, не имеющие расширенных вариантов акустических систем не будут чувствовать себя дискомфортно -система будет масштабироваться под параметры системы, имеющейся в наличии. Многие спутниковые телеканалы вещают в 5.1, но это ни как не отражается на большинстве зрителей, имеющих телевизоры с моно-звуком.

Используемая в Dolby Digital схема компрессии данных АСЗ обладает очень высокой эффективностью (коэффициент сжатия может быть более 12:1, поддерживаемая скорость передачи от 64 до 448 кбит/с) и при этом довольно высоким субъективным качеством звука. АСЗ, как и все современные схемы сжатия данных звуковых потоков (в частности, МРЗ), использует в своей работе особенности слухового восприятия человека, или психоакустическую модель. Например, в присутствии громкого сигнала некоторой частоты более тихие и имеющие немного более высокую или низкую частоту звуки маскируются громким сигналом, то есть не слышны или слышны очень плохо. Также маскируются сигналы, звучащие после и даже перед громким звуком. Это явление позволяет не кодировать или кодировать с меньшей разрядностью маскируемые звуки. Компрессия данных осуществляется также путем недеструктивного избавления от избыточной информации, примерно по тем же алгоритмам, которые применяются в архиваторах ZIP или RAR. Для реализации этих схем входящий поток аудиоданных разбивается во времени - на перекрывающиеся блоки (фреймы) по 512 сэмплов, при частоте дискретизации 48 кГц это составляет 10,66 мс, если же в сигнале присутствуют резкие перепады уровня, то размер блока уменьшается вдвое, чтобы качественно передать эти быстрые скачки; и по частоте - весь звуковой диапазон в 24000 Гц разбивается на 256 сегментов, что дает ширину каждой полосы в 93,75 Гц. Затем звуковая информация в каждой частотной полосе из блока данных переводится в формат числа с плавающей запятой , и по определенной психоакустической модели производится обработка входящих значений (какие-то частотные полосы вообще не несут значимой информации и не кодируются, какие-то нужно закодировать с большей разрядностью, какие-то с меньшей), результатом которой является существенное уменьшение потока данных. Интересно, что психоакустическая модель, используемая кодером, может меняться, так как параметры модели передаются в потоке АСЗ и затем могут использоваться декодером для восстановления исходного звучания. Еще одним способом уменьшения потока данных является объединение данных из разных каналов. В реальной многоканальной фонограмме в нескольких каналах звуковая информация зачастую пересекается, и ее можно закодировать один раз для всех, а не для каждого канала в отдельности. Эта техника применяется только для частот ниже 10 кГц, что позволяет сохранить локализацию источников звука, а при том, что в распоряжении кодера есть целых пять полноценных звуковых каналов и, соответственно, широкое поле для маневра, поток данных этим способ можно уменьшить довольно значительно.

Возможности Dolby Digital на этом не исчерпываются. Например, декодер предусматривает управляемую компрессию (сжатие динамического диапазона). Использование компрессии удобно, если слушателю по какой-либо причине необходимо ограничить общую громкость звука. Компрессор повышает уровень слабых звуков, чтобы они были отчетливо слышимы, и наоборот, ослабляет слишком сильные звуки. Пользователь может сконфигурировать цифровой декодер таким образом, чтобы низкочастотные составляющие присутствовали только в тех каналах, для которых предусмотрены subwoofer-ы или широкополосные акустические системы с отдельными низкочастотными громкоговорителями.

Dolby Digital EX и Dolby-E

Только для кинотеатров изначально была разработана расширенная система Dolby Digital EX - семиканальная, по схеме "6.1". В Dolby Digital EX предусмотрено не два, а три канала surround - пространственный левый LS, пространственный правый RS и пространственный центральный CS. Акустические системы канала CS размещаются вдоль задней стены кинозала, а системы каналов LS и RS - вдоль боковых стен.

Dolby Digital использует цифровую компрессию звука, обеспечивающую минимальную необходимую скорость цифрового потока - до 320 кбит/сек. Это позволяет наиболее эффективно использовать информационную емкость носителей или каналов связи - пространство на пленке, магнитной ленте, частотную полосу эфирного или спутникового канала и т. п. Платой за низкую скорость является то обстоятельство, что формат Dolby Digital рассчитан только на один цикл кодирования - декодирования. Кроме того, цифровой поток АС-3 не привязан по времени к кадровой структуре изображения, поэтому редактировать видеоматериалы со звуком Dolby Digital сложно.

Рис. 15. Dolby Digital EX и Dolby-E

В профессиональных приложениях зачастую возникает необходимость в многократном кодировании-декодировании. Например, станции-ретранслятору необходимо получить материал с цифровым звуком Surround по спутниковому каналу связи, сохранить его на цифровом носителе, отредактировать, смонтировать и затем ретранслировать в распределительную сеть (или тиражировать и распространить). Для таких задач Dolby Laboratories разработала профессиональный цифровой формат Dolby-E. Цифровой поток Dolby-E может содержать до восьми каналов звука с полной полосой частот. Кроме собственно сжатых данных звука, в поток вводятся метаданные (metadata) - "данные, описывающие данные". Это инструкции для декодера Dolby-E, которые носят необязательный, рекомендательный характер. Например, специальная инструкция может автоматически установить в декодере то или иное ограничение динамического диапазона выходных сигналов. В зависимости от оборудования, используемого для приема и обработки сигнала Dolby-E, метаданные могут использоваться полностью, частично или не использоваться вообще. Поток Dolby-E делится на два потока, которые могут быть переданы по двум физическим линиям стандарта AES-3 или записаны на цифровой магнитофон вместо двух каналов несжатого звука. Структура потока соответствует кадровой структуре видео, поэтому материал со звуком Dolby-E можно легко монтировать и редактировать, не нарушая синхронность аудио и видео. Формат допускает до 10 последовательных циклов кодирования - декодирования.

21