Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
первые 10 вопросов по звукорежиссуре.doc
Скачиваний:
70
Добавлен:
14.04.2015
Размер:
259.58 Кб
Скачать

7. Аналоговое и цифровое представление музыкальных и речевых сигналов

Как уже отмечено выше, в современной студийной звукозаписи за последние десятилетия произошел переход от аналоговой техники к цифровой. Все современные музыкальные компьютерные технологии производят только цифровую обработку сигналов. Цифровая запись и обработка звука имеет ряд преимуществ: обеспечение большого динамического диапазона, низкого уровня шумов, малых нелинейных искажений и др.; гибкость, т. е. удобство программирования и перепрограммирования; повторяемость, возможность быстрого дублирования, стабильность при изменении внешних условий; легкость выполнения целого ряда функций, которые сводятся к некоторым стандартным операциям сложения, вычитания, умножения (сдвига) и деления двоичных чисел; долговечность при хранении информации; огромный объем обрабатываемой информации и др.

В данном разделе будут кратко приведены сведения по основным операциям при переходе от аналогового к цифровому звуку (дискретизация, квантование и кодирование), необходимые для дальнейшего изложения. Подробнее с этими вопросами, а также другими видами цифровой обработки звуковых сигналов можно ознакомиться в литературе [16, 24-29].

Классификация сигналов. В технической литературе принято следующее определение сигнала: «процесс изменения во времени физического состояния какого-то объекта, в результате которого осуществляется передача энергии и информации» [16, 27]. В теории связи под сигналом понимается «варьируемая переменная, с помощью которой передается информация по электронным цепям» [24].

В практике работы звукорежиссера приходится иметь дело со звуковыми сигналами, которые могут быть классифицированы по различным признакам:

— по способу их физического представления — на акустические сигналы (в виде вариаций звукового давления или плотности в воздушной среде) и электрические сигналы (переменное напряжение (ток) в электрической цепи). На первом этапе звукозаписи от источника до микрофона сигнал имеет акустическое представление, с выхода микрофона поступает уже электрический сигнал, с которым и производятся все виды обработок на микшерном пульте, в компьютере и т. д., затем сигнал сохраняется и передается в электрической (проводные сети) или электромагнитной (сети радиовещания, телевидения и др.) форме; только на последнем этапе сигнал с помощью громкоговорителя восстанавливается в акустическом виде, в котором и поступает в слуховую систему (следует отметить, что внутри нее он опять конвертируется в электрическую форму — см. гл. 3);

— по степени их предсказуемости сигналы могут быть разделены на детерминированные, случайные, квазислучайные. Как уже было отмечено в главе 2, музыкальные и речевые сигналы относятся к квазислучайным нестационарным сигналам, поэтому для их изучения используются методы статистической теории, а также методы спектрального и корреляционного анализа [15, 28];

— по характеру изменения значений функции, описывающей сигнал, и ее переменной (аргумента) можно выделить три класса сигналов:

1) непрерывные (аналоговые), в которых значения функции и аргумента изменяются непрерывно и могут быть измерены в любые моменты времени. Аудиотехника работала именно с этими видами сигналов на протяжении всего периода ее развития с 30-х до 90-х годов XX века;

2) дискретные, в которых значения функции изменяются непрерывно, а аргумент может принимать только строго фиксированные значения. Дискретный звуковой сигнал можно представить в виде последовательности импульсов, амплитуда которых зависит от значения сигнала в данный момент времени (АИМ); можно также применять импульсы, ширина которых пропорциональна амплитуде сигнала (ШИМ) (рис. 6.2.1). Дискретные сигналы стали применяться в радиотехнике с 40-х годов [28];

цифровые, в которых значения функции и аргумента могут быть только дискретными. Полученные значения сигналов представляются в виде определенной последовательности чисел (рис. 6.2.2). Операции преобразования аналогового сигнала в цифровой называются; дискретизацией (сэмплированием), квантованием и кодированием [15, 16, 24-28]. Необходимо отметить при этом, что аналоговый сигнал несет полную информацию о реальном звуковом мире в любые моменты времени с любой точностью (например, звучание скрипки, пение, шум и др.); цифровые сигналы передают эту информацию всегда с определенной погрешностью, т. к. в промежутках между отсчетами (сэмплами) информация теряется; кроме того, она неточно передается и по уровню, т. к. используются только квантованные значения. Эти неточности заложены в природу цифрового сигнала. По мере повышения быстродействия современной компьютерной техники эти погрешности становятся все меньше и приближаются к порогам чувствительности слуха.

Следует отметить еще одно различие аналоговых и цифровых сигналов: когда в аналоговом сигнале изменяется частота, амплитуда или фаза в одной форме его представления, например в акустической, пропорционально изменяются эти же параметры в другой форме его представления, например электрической; при этом они в значительной степени взаимосвязаны. В цифровом сигнале изменение цифровых данных, описывающих, например, частоту, не приводит к изменению данных, описывающих амплитуду и др., поэтому при обработке цифровых сигналов возможны такие операции, как сдвиг высоты без растяжения (сжатия) сигнала по времени.

Цифровая обработка сигналов — ЦОС (Digital Signal Processing — DSP) включает в себя: анализ, синтез и изменение (обработку) информации, передаваемой в виде дискретной последовательности чисел (т. е. в виде потока электрических импульсов, несущих закодированную в двоичном коде информацию) [26, 29].

В основе всех музыкальных компьютерных программ, используемых в практике работы со звуком, лежит цифровая обработка сигналов, включающая некоторый стандартный набор операций: дискретизацию (сэмплирование), квантование, кодирование, преобразование Фурье (FFT) и др. Ниже будут кратко рассмотрены основные из них.

Дискретизация. Преобразование сигнала из непрерывной формы в дискретную можно представить как результат измерения мгновенных значений сигнала (например, напряжения) через постоянные (дискретные) промежутки времени.

Полученная совокупность отсчетов затем преобразуется в числовую последовательность и передается для последующей обработки, например в компьютере. Этот процесс называется дискретизацией, или сэмплированием (слово «сэмпл» употребляется также и в другом значении — «образец записи звучания какого- либо отрезка музыки, речи, шума и др.»). Среди методов цифрового представления наиболее известна импульсно-кодовая модуляция (ИКМ), которая реализуется в специальном устройстве АЦП. Принципиальная схема его показана на рис. 6.2.3: входной сигнал U(t) ограничивается по полосе низкочастотным фильтром (ФНЧ) и поступает в амплитудно-импульсный модулятор (АИМ), где происходит его дискретизация, т. е. считывание значений с помощью генератора тактовых импульсов (ГТИ). Выходной сигнал АИМ-модулятора представляет собой временную последовательность отсчетов (рис. 6.2.4), отстоящих один от другого на интервал времени Т , называемый периодом дискретизации. Величина f, обратная периоду (интервалу) дискретизации (/д = 1/Тд), называется частотой дискретизации.

Частота дискретизации (sample rate) равна числу отсчетов сигнала в секунду. Например, если указана частота дискретизации в компьютере 48 кГц, то это означает, что в АЦП, установленном на звуковой карте, выполнено 48000 отсчетов сигнала в секунду.

Сигнал, показанный на рис. 6.2.4, называется дискретным. В кодере АЦП выходной сигнал затем квантуется по уровню и кодируется. Рассмотренная схема является простейшей. Реальные ИКМ-преобразователи содержат и некоторые другие функциональные блоки, уменьшающие погрешности преобразования [15, 16].

Выбор частоты дискретизации является важнейшей операцией при обработке музыкальных и речевых сигналов в компьютерах и других цифровых устройствах. Для адекватного представления сигнала (особенно содержащего много высокочастотных составляющих в спектре) и его последующего восстановления в ЦАП необходимо брать достаточно большое количество отсчетов (рис. 6.2.4). С другой стороны, когда выбрано слишком много отсчетов, появляется много коррелированных значений сигнала, которые не оправдывают затрат времени на их сохранение; кроме того, большое количество отсчетов значительно увеличивает время на обработку сигнала и определяется пропускными возможностями компьютера и других цифровых приборов.

В соответствии с теоремой Котельникова — Найквиста: «неискаженная передача непрерывного (аналогового) сигнала с полосой частот 0... fmax дискретной последовательностью его отсчетов возможна только в том случае, если частота дискретизации fR связана с максимальной частотой fmax исходного сигнала следующим соотношением» [28]:> 2fmax.

Например, если нужно передать музыкальный сигнал с полосой воспроизведения 30-20000 Гц, то частота дискретизации должна быть выбрана не ниже 40000 Гц.

В настоящее время в лазерных проигрывателях и бытовых магнитофонах принята частота дискретизации 44,1 кГц, в профессиональных системах звукозаписи и радиовещания — 48 кГц, в современных студийных устройствах уже используются частоты 96 кГц, 192 кГц (например, в DVD-Audio).

При согласовании различной аппаратуры иногда возникает необходимость изменения частоты дискретизации: уменьшение частоты дискретизации называется децимацией, при этом задается коэффициент децимации (Decimation Ratio), который указывает, какое количество отсчетов сигнала должно быть взято для усреднения и последующей замены на это усредненное значение. Увеличение частоты дискретизации происходит с помощью процесса интерполяции, т. е. дополнения промежуточных значений сигнала; способы, которыми это может быть реализовано, приведены в литературе [24-29].

Квантование. После дискретизации звуковой сигнал имеет дискретные значения аргумента (времени), но сохраняет непрерывное изменение значений функции (напряжения). Однако из-за ограниченной разрядности элементов памяти и операционных систем цифровых приборов сигналы в них могут передаваться только с ограниченной точностью. Поэтому производится операция квантования. При этом непрерывное множество значений функции заменяется на некоторое конечное разрешенное число, которое определяется числом уровней квантования (рис. 6.2.2). Расстояние между соседними разрешенными уровнями квантования называется шагом квантования. Каждое значение отсчета сигнала заменяется (округляется или отбрасывается) ближайшим к нему разрешенным значением. Квантование — операция нелинейная и неизбежно вызывает ошибку квантования, при которой (в отличие от дискретизации) сигнал нельзя передать со сколь угодно малой ошибкой ни при каком конечном шаге квантования.

Разность между исходными и квантованными значениями отсчетов изображена на рис. 6.2.5. Эта разность, т. е. сигнал ошибок называется шумом квантования. Чем меньше величина шага Д при квантовании отсчетов дискретизированного сигнала, тем меньше по уровню этот шум квантования. Его мощность связана с величиной шага квантования следующим соотношением: Рш кв = А2/ 12. Спектр шума квантования равномерный в полосе частот 0... Уд/2. Поскольку мощность шума квантования зависит не от уровня входного сигнала, а только от выбранного шага квантования, то при слабых уровнях сигнала шум квантования вносит слышимые искажения. Для его уменьшения используются различные способы неравномерного квантования [16, 24-28].

Кодирование — процесс представления квантованного отсчета значений сигнала в двоичной системе счисления. Таким образом, каждому квантованному уровню сигнала сопоставляется некоторое число, содержащее определенное количество цифр, — так называемое кодовое слово. Двоичные кодовые слова состоят из двух цифр: 0 и 1. Любое число в двоичной системе может быть представлено в виде:

А = а 2т~1 +а , 2т'2 +.... ап 2°.

т-1 т-2 0

Число А в системе с основанием 2 записывается только последовательностью коэффициентов а т1, ат 2 ап, которые могут принимать значения 0 или 1 .Число т называется разрядом слова и определяет количество цифр, из которых оно состоит. При т = 4 число А содержит четыре цифры (например, 1011) и может быть представлено как: А = 1 • 23 + 0- 22 + 1 • 2' + 1 • 2° (в десятичной системе это число равно 11). Приемы перевода чисел из десятичной системы в двоичную и наоборот даны в работах [16, 24-28].

Двоичные символы 0 и 1, входящие в состав кодовых слов, называют битами. Это слово произошло от английского «bit», составленного из начальных и конечной букв словосочетания «binary digit», что означает «двоичная цифра».

Выбор определенного количества бит определяет длину слова, т. е. количество цифр, которое может использоваться для каждого уровня квантования. Число возможных уровней квантования, которое может быть закодировано с помощью выбранного числа бит, определяется числом перестановок из заданного количества цифр. Например, выбрав число бит равным двум, т. е. задав длину слова из двух цифр, можно получить только четыре, т. е. 22 разные перестановки, и соответственно закодировать только четыре уровня следующими комбинациями цифр: 00, 01, 10, 11. Соответственно, задав произвольное число m бит, можно закодировать N уровней, число которых N = 2т. Например, при m = 16 бит можно закодировать число уровней 216 = 65536. Если задано число уровней, например, N = 256, то число бит определится как т = ln/N), т. е. будет равно т = 8.

Чем больше динамический диапазон звукового сигнала, тем больше уровней требуется для его квантования (при сохранении низкого уровня шума квантования) и тем больше требуется цифр в слове, т. е. числа бит, для их кодирования.

Динамический диапазон сигнала D связан с числом бит т следующим приближенным соотношением [16J: D = 6 т. Поэтому для увеличения динамического диапазона в современной звуко-технике происходит переход на число разрядов 24 бит при уровне квантования 96 кГц.

Скорость передачи цифрового потока определяется как С = f х т, Где/, — частота дискретизации, т — число бит. Например, при частоте дискретизации 48 кГц и числе разрядов 16 бит скорость потока равна 768 кбит/с.

Разумеется в реальных цифровых системах процессы квантования и кодирования представляют собой достаточно сложные процессы преобразования сигналов, выше приведены только основные определения [16, 23-29].

После того как звуковой сигнал прошел в АЦП операции дискретизации, квантования и кодирования, он в виде последовательности цифр вводится в цифровое устройство (например, компьютер), где и подвергается различным видам обработки (анализу, синтезу, фильтрации и др.). Спектральный анализ сигналов (см. гл. 2) в современных компьютерах производится обычно с помощью алгоритмов быстрого преобразования Фурье — БПФ (FFT). Для цифровой фильтрации и- процессорной обработки используется большое количество различных алгоритмов. Представление о некоторых из них будет дано в разделе 6.3; более подробно с этой темой можно ознакомиться в литературе [24-29].

Затем цифровой сигнал после обработки подвергается обратному преобразованию в цифро-аналоговом устройстве (ЦАП), на выходе которого получается аналоговый сигнал. Он может быть подведен к громкоговорителям или стереотелефонам для прослушивания. Принципы действия ЦАП можно найти в работах [15, 16, 23-29].

В настоящее время практически все системы звукозаписи, звукопередачи и звуковоспроизведения используют цифровую обработку сигналов, что открывает перед ними значительно большие возможности, чем при работе с аналоговыми сигналами.

8. Преобразование аналогового звукового сигнала в цифровой включает в себя несколько этапов. Сначала аналоговый звуковой сигнал подается на аналоговый фильтр, который ограничивает полосу частот сигнала и устраняет помехи и шумы. Затем из аналогового сигнала с помощью схемы выборки / хранения выделяются отсчеты: с определенной периодичностью осуществляется запоминание мгновенного уровня аналогового сигнала. Далее отсчеты поступают в аналого-цифровой преобразователь (АЦП), который преобразует мгновенное значение каждого отсчета в цифровой код или числа. Полученная последовательность бит цифрового кода, собственно, и является звуковым сигналом в цифровой форме. В результате преобразования непрерывный аналоговый звуковой сигнал превращается в цифровой – дискретный как по времени, так и по величине. Для примера на рисунке показана структурная схема канала цифровой записи звука.

Главную роль в процессе преобразования сигнала из аналоговой формы в цифровую играет АЦП (Analog/Digital Converter – ADC). Обратный процесс преобразование цифрового звукового сигнала в аналоговый реализуется с помощью цифро-аналогового преобразователя – ЦАП (Digital/Analog Converter – DAC).

9. Схема работы устройства чтения – записи компакт-дисков достаточна проста.

1. Лазерный диод излучает маломощный пучок света длиной 730–780 нм, который, проходя через направляющую призму и разделитель луча, попадает на отражающее зеркало.

2. Подчиняясь командам микропроцессора, каретка с отражающим зеркалом перемещается к нужной дорожке.

3. Лазерный луч отражается от диска, попадает на зеркало, затем на разделитель луча и далее на направляющую призму.

4. Из призмы луч попадает в фотодатчик, фотодатчик посылает сигналы во встроенный в привод компакт-дисков микропроцессор, где данные обрабатываются и передаются по шлейфу на материнскую плату.

Приводы компакт-дисков выпускаются различными фирмами: Yamaha, Plextor, Hitachi, HP, Sony, Ricoh, Philips, Panasonic, ТЕАС, AOpen, Mitsumi и др. Стоимость CD– и DVD-приводов зависит от качества модели, уровня фирмы-производителя, функций и технических характеристик.

Принцип оптического считывания информации в СД-проигрывателях

Для считывания информации с компакт-диска используется лазерная головка (ЛГ). В корпусе ЛГ установлены лазерный диод, внутренняя оптическая система (дифракционная решетка, цилиндрическая, коллиматорная и другие линзы, призма), катушки фокусировки и трекинга с фокусирующей линзой, лазерный диод.

При подаче напряжения питания полупроводниковый лазерный диод генерирует когерентный (разность фаз волн постоянна во времени) луч, который с помощью дифракционной решетки разделяется на основной луч и два дополнительных. Пройдя через элементы оптической системы и фокусирующую линзу, эти лучи попадают на компакт-диск .

Точную фокусировку лучей на диске осуществляют катушки фокусировки, устанавливающие нужное положение линзы. Отразившись от диска, лучи снова попадают на фокусирующую линзу и дальше в оптическую систему. При этом отраженные лучи отделяются от падающих благодаря их разной поляризации. Перед тем, как попасть на фотодатчики (фотодиодную матрицу), основной луч проходит через цилиндрическую линзу, в которой используется эффект дисторсии для определения точности фокусировки.

Если луч сфокусирован точно на поверхности компакт-диска, отраженный луч на фотодатчиках имеет форму круга, если перед или за поверхностью - форму эллипса.

Сигналы с фотодатчиков предварительно усиливаются, и по разности сигналов (A+C) и (B+D) определяется ошибка фокусировки FE (Focus Error). При точной фокусировке сигнал FE равен нулю.

Два боковых луча попадают на датчики E и F. Они используются для отслеживания прохождения основного луча по считываемой дорожке (треку).

Разность сигналов E и F определяет ошибку трекинга (отслеживания дорожки) TE (Tracking Error).

Суммарный сигнал с датчиков A, B, C и D представляет собой высокочастотный (RF) сигнал (>4 МГц) в формате EFM (Eight-to-Fourteen Modulation). Он содержит закодированную аудиоинформацию и дополнительные данные.