2.2.Кодирование рсм

Метод натуральной цифровой записи звука называется РСМ (Pulse Code Modulation - импульсно-кодовая модуляция). Он заключается в том, что в ходе записи в течение каждой секунды многократно регистрируется текущая амплитуда звуковой волны. Некоторое значение амплитуды рассматривается как предельное, которое может быть представлено в звукозаписи. Ему соответствует максимальное целое число, которое "умещается" внутри соответствующего элемента данных. Текущее значение масштабируется относительно максимального и округляется до ближайшего целого числа. В результате получается как бы моментальный снимок звуковой волны. Вся звукозапись представляет собой последовательность таких "снимков".

Терминология, используемая в компьютерной цифровой звукозаписи, не устоялась как в русском, так и в английском языке, что выражается в том, что одни и те же термины используются для обозначения совершенно разных понятий. Так, с помощью английского термина sampleобозначают как отдельный "снимок" звуковой волны, так и всю временную последовательность таких снимков. На русском языке в том же смысле часто используют термин "сигнал".Сигналобозначает отдельный снимок звуковой волны, а всю последовательность сигналов мы будем рассматривать какволновуюформу (в соответствии с другим часто используемым английским терминомwaveform).

2.3.Стандартный формат оцифровки звука

Ясно, что в ходе представления звукозаписи в цифровой форме в нее вносятся некоторые искажения. Во-первых, измеренная амплитуда звука не обязана выражаться в нашем представлении целым числом. В результате возникает погрешность округления, которая может проявляться в возникновении шумового фона. Представление звука в виде дискретной последовательности сигналов, а не в виде непрерывной волны также способно порождать дефекты звучания.

2.4.Параметры дискретизации

Тем самым, качество и особенности записи определяется параметрами аналогово-цифрового преобразования. Разрядность представленияуказывает, сколько битов выделяется для записи сигналов, то есть задает точность представления амплитуды звуковой волны. Например, при восьмиразрядной записи звука величина сигнала может изменяться от -127 до 127 (всего 255 значений), при шестнадцатиразрядной - от -32767 до 32767 (всего 65535 значений).

От разрядности зависит отношение максимально возможной громкости звука к громкости шумового фона, появляющегося из-за неизбежных погрешностей дискретизации. Слуховая система человека способна воспринимать звуки, диапазон которых превышает 100 дБ (децибел). При восьмиразрядной записи представимый диапазон составляет 48 дБ, при шестнадцатиразрядной 96 дБ, что уже сравнимо с предельными возможностями человеческого слуха.

Частота дискретизацииуказывает, сколько раз в секунду регистрируются сигналы. В принципе, понятно, что чем выше эта частота, тем более точной оказывается запись. Однако при выборе частоты дискретизации необходимо учитывать свойства человеческого уха и законы физики.

Человеческое ухо способно слышать звук в частотном диапазоне примерно 15-20000 Гц. Существует правило, которое у нас называют теоремой Котельникова, а за рубежом - правилом Нюквиста, согласно которому частота дискретизации должна не менее чем вдвое превосходить максимальную частоту записываемого звука. Если это ограничение не выполнено, то при воспроизведении такой записи слышны звуки низкой частоты, которые отсутствовали в исходной звуковой волне.

Понять, почему такое происходит, можно на следующем примере. Вспомните, как на кино- и телеэкране выглядит движение автомобиля, особенно на старых пленках. Порою кажется, что колеса машины вращаются очень медленно и притом вообще в другую сторону. Это вызвано тем, что частота кадров (которая в данном случае играет роль частоты дискретизации) слишком мала.

Между двумя последовательными кадрами, запечатленными на пленке, колесо автомобиля делает почти полный оборот, а зрительная система человека воспринимает "почти полный оборот вперед" как "небольшой поворот назад". Применительно к этому примеру теорема Котельникова гласит, что частота кадров должна быть такой, что между последовательными кадрами колесо не должно поворачиваться больше, чем на пол-оборота.

Точно то же самое происходит и в случае звукозаписи. При недостаточной частоте дискретизации пропускаются "пики" или, наоборот "впадины" звуковой волны, в результате чего регистрируемая частота оказывается значительно меньше реальной.

"Восстановленная" аналоговая форма из-за недостаточной частоты дискретизации содержит значительно меньше колебаний, чем исходная волна.

Понятно, что чем выше частота дискретизации и разрядность, тем более качественной окажется запись. Однако просто увеличивать эти параметры не имеет смысла, так как при этом увеличивается объем отдельного сигнала и число сигналов, а, следовательно, и объем записи (в том числе объем данных, которые должны обрабатываться каждую секунду при ее воспроизведении). Таким образом, нужны минимальные значения, обеспечивающие высокое качество.

<<< < Предыдущая 1 2 3 45 / 155 6 7 8 9 10 11 12 13 14 15 > Следующая >>>