- •Список сообщений
- •Треки и клипы
- •Sweet Spot
- •Частотная характеристика
- •Ушная раковина (Pinna)
- •Неподвижные источники звука
- •Каково же будет решение?
- •Хорус как таковой
- •Хорус в Cool Edit Pro 2
- •Хорус в SONAR 2.1
- •Простые методы сжатия
- •Методы сжатия, основанные на психоакустике
- •Некоторые факты о восприятии звука
- •Транзиентные сигналы
- •1. Оцифровка звука и его хранение на цифровом носителе
- •2. Преобразование звука из цифрового вида в аналоговый
- •3. Способы хранения цифрового звука
- •4. Преимущества и недостатки цифрового звука
- •5. К вопросу об обработке звука
- •6. Аппаратура
- •7. Программное обеспечение
- •8. Перспективы и проблематика
- •Глоссарий терминов
- •Уровень и динамический диапазон звукового сигнала
- •Устройства динамической обработки
- •Структура устройств динамической обработки
- •Временные характеристики
- •Уровень и динамический диапазон звукового сигнала
- •Устройства динамической обработки
- •Структура устройств динамической обработки
- •Временные характеристики
- •Дилэй и эхо - близнецы-братья
- •Дилэй и эхо в Cool Edit Pro 2
- •Дилэй в SONAR 2
- •Дилэй в Cubase SX
- •FFT фильтр
- •IIR фильтры
- •FIR фильтры
- •Введение
- •Wave файл с компрессией ADPCM
- •MPEGplus/Musepack (MP+/MPC/MPP)
- •TwinVQ (VQF)
- •Liquid Audio
- •OGG Vorbis
- •Качество Звучания
- •Заключение
- •Глоссарий:
- •Полезные ссылки:
- •Создаем аудиотрек
- •Выбираем порт ввода звуковых данных
- •Выбираем порт вывода
- •Чтобы не работать впустую
- •Регулируем уровень сигнала
- •Спет куплет
- •Словарик
- •Классический спектр
- •Текущий спектр
- •Мгновенный спектр
- •Отображение мгновенного спектра
- •Сколько весит спектр?
- •Список сообщений
- •Треки и клипы
- •Audio-CD
- •Что влияет на качество воспроизведения Audio-CD?
- •Является ли CD-R, переписанный с обычного CD, точной копией исходного диска?
- •Чем, в таком случае, отличается привод CD-R[W] за $2.000 от привода за $200?
- •Можно ли получить абсолютную копию звука Audio-CD в обычный wav-файл ("сграбить" - англ. "grab")?
- •Какой грабер лучше использовать?
- •Формат сжатия MP3 - общие вопросы
- •Откуда у тебя такая любовь к кодеру Producer 2.1?
- •Если ты даже не смотрел {MP3enc, Lame, Bladeenc, OGG Vorbis, *.* AAC, впишите_сюда_своё}, то почему ты уверен, что Producer 2.1 лучше всех?
- •Всё же, какой кодер самый крутой?
- •Ты совсем не упомянул кодер <n>!
- •Можно ли отличить MP3-256 от оригинала на слух?
- •??? Я всегда считал, что MP3-256 неотличим на слух от оригинала?
- •Может быть, еще увеличить поток поможет? Как насчет MP3-320?
- •А можно ли отличить MP3-256 от оригинала, сравнивая их таким же интенсивным образом, но в слепом тесте?
- •Значит, отличить всё же можно. Почему тогда ты говоришь в своей статье - 'MP3-256 не изменяет параметры звука хоть сколь заметным человеку образом'?
- •Так в каком же случае можно считать MP3-256 оригиналом?
- •Ну и чем кодировать в MP3-256?
- •Немного философии
- •Тебя не смущает, что все твои записи закодированы в MP3-256, и в один прекрасный момент ты обнаружишь их некачественность?
- •Я понял - тебя просто не волнует качество звука. Может, ты просто не слышишь разницы?
- •Если MP3-256 оставляет, как ты говоришь, практически оригинал, можно ли использовать его в студии?
- •Что такое MP3 ?
- •Детали
- •Настоящее и будущее MP3
- •Описание процесса кодирования
- •Подготовка к кодированию. Фреймовая структура
- •Начало кодирования
- •Работа психоакустической модели.
- •Завершение кодирования
- •Замечание
- •Способы кодирования стерео сигнала
- •Простые заблуждения и ошибки, делаемые пользователями MP3
- •Немного о программах
- •Немного о некоторых битрейтах
- •VBR & XingTech
- •Способы хранения MP3
- •Характер потерь при кодировании
- •Тестирование качественности кодеров
- •Психоакустическая модель и разные битрейты
- •Какие, собственно, кодеры у нас в распоряжении
- •Всякое-разное
- •Что такое front-end ?
- •Что такое ACM pro codec ( MP3-кодек ) ?
- •Файлы какого формата можно перевести в формат MP3?
- •Каков статус MP3 кодеров?
- •Каковы системные требования ?
- •Выводы
- •Чем компьютер может помочь в работе над музыкой?
- •Насколько качественно компьютер исполняет и обрабатывает музыку?
- •Можно ли делать всю музыку только на компьютере?
- •Что выбрать - трекер или синтезатор с секвенсором?
- •Где можно найти информацию по работе над музыкой?
- •Кратко об истории и характеристиках стандартов MPEG
- •Что такое CBR и VBR?
- •Каковы отличия режимов CBR, VBR и ABR? (применительно к кодеру Lame)
- •Какие методы кодирования стерео информации используются в алгоритмах MPEG (и других)?
- •Какие параметры предпочтительны при кодировании MP3?
- •Какие алгоритмы компрессии существуют (альтернативы MP3 и др.)?
- •кодирование с потерями качества / lossy coding
- •кодирование без потерь качества / lossless coding
- •Можно ли осуществить преобразование из одного потокового формата аудио данных в другой?
- •Можно ли осуществить преобразование WAV в MIDI, WAV в трекерный модуль?
- •Можно ли выделить из аудио потока звучание конкретного инструмента или голоса?
- •Какие существуют способы преобразования MIDI в WAV?
- •Какой метод сравнения двух аудио сигналов можно признать наиболее точным?
- •Что такое стеганография?
- •Clip Restoration - алгоритм, функционирующий на грани мистики
- •Noise Reduction - шумоподавитель идет по следу
- •Альфа. Программы
- •Бета. Постановка задачи
- •Гамма. Подготовка к восстановлению
- •Дельта. Два способа
- •Дзета. Стерео и дорожки. Щелчки и винил
- •Эта. Фильтрация
- •Тэта. Вычитание или подавление?
- •Иота. Многополосная фильтрация
- •Каппа. Sono luminus
- •Лямбда. Полуфинал
- •Ми. Финал
- •Омега. Суперфинал
- •Графический эквалайзер
- •Параметрический эквалайзер
- •Практикум
- •Кроссовер
- •Совет 1 - Surround stereo, типа.
- •Совет 2 - Кайфные Ведущие.
- •Совет 3 - Эффективное Панорамирование.
- •Совет 4 - Попадаем в Качание вселенского маятника.
- •Предисловие к "ничему"
- •Пики и Впадины
- •Мелодия
- •Groove? Что за Groove?
- •Мля. Только не C, Dm, F, G
- •Последнее, но немаловажное
- •Выразительные средства музыкального языка
- •Динамическое развитие
- •Темповое развитие
- •Мелодическое развитие
- •Ритмическое развитие
- •Тембровое развитие
- •Имитация акустической среды
- •Звуковые эффекты
- •Вибрато
- •Амплитудное вибрато и тремоло
- •Частотное вибрато
- •Тембровое вибрато
- •Немного анатомии (устройство уха - коротко и ясно)
- •О чувствительности (по мощности и частотной)
- •О фазовой чувствительности
- •Об объемном восприятии
- •О нотах и октавах. Гармоники
- •1. Способы преобразования звука
- •2. Звуковые эффекты
- •Использование задержки
- •Преобразование амплитуд
- •Частотные преобразования
- •Использование эффекта реверберации в профессиональных приложениях
- •Сущность эффекта реверберации
- •История искусственной реверберации
- •Цифровые ревербераторы
- •Типы реверберации
- •Параметры реверберации
- •Управление реверберацией по MIDI
- •Способы практического использования
- •Компрессоры и компрессия
- •Оживление искусственных барабанов
- •Советы по эквализации музыкальных инструментов
- •Практика записи
последующего воспроизведения) множества музыкальных композиций. Это означает, что использование кодека очень нецелесообразно и не рекомендуется при составлении фонотеки или для постоянного хранения аудио. С другой стороны, кодек может занимать выигрышные позиции в области потокового аудио.
9 октября 2002 года компания Coding Tech. анонсировала выход нового кодека AACPlus. AACPlus основан на совершенно аналогичной MP3Pro идее использования технологии SBR. Разница заключается лишь в том, что в MP3Pro основной поток кодируется в MP3 (MPEG-1 Layer III), а в AACPlus – в AAC (MPEG-2/4 AAC). ААС является младшим и намного более развитым кодеком, чем MP3, что позволяет ожидать от AACPlus более качественных результатов кодирования. Однако, относительно нового AACPlus, вероятно, можно будет сделать почти те же общие выводы, что и в отношении к MP3Pro.
Кодек MPEGplus (MPEG+) - это еще одна разновидность MP3, на этот раз не являющаяся фактическим продолжением MPEG-1 Layer III. MPEGplus создан "в домашних условиях", то есть написан одним единственным человеком по имени Andree Buschmann. Кодек построен на алгоритме, базирующемся на MPEG-2, однако его математическая модель значительно отличается от и от MP3 (MPEG-1 Layer III), и от MPEG-2. Кодек обеспечивает высокое качество кодирования и по совокупности достоинств схож с Ogg Vorbis с различиями в приоритетах "качество vs. битрейт".
кодирование без потерь качества / lossless coding
Кодирование данных без потерь - это способ кодирования аудио, который позволяет осуществлять сто процентное восстановление данных из сжатого потока (иными словами, декодирование сжатых таким способом данных точно восстанавливает оригинальный сигнал из сжатого). Кодирование аудио с использованием любого из перечисленных выше кодеров (lossy coders), как уже было упомянуто, приводит к деградации качества, поскольку сама цель описанных выше кодеров - любыми способами добиться схожести звучания с оригиналом при меньшем занимаемом данными объеме - достигается путем использования различных алгоритмов, "упрощающих" оригинальный сигнал (выкидывая из него "ненужные" слабослышимые детали), что приводит к тому, что декодированный сигнал перестает иметь что-то общее с оригиналом, а лишь похоже звучит.
Lossless кодеры основаны на другой идее - попытаться максимально сжать данные, не нарушая при этом целостности оригинальной информации. Иными словами, цель - сжать данные так, чтобы полученных послесжатия данных хватило для абсолютно точного восстановления из них оригинального сигнала. То есть, lossless кодеры - это своеобразные архиваторы (как Zip или Rar), однако предназначенные для кодирования именно аудио (с помощью них, наверняка можно сжать вообще любые данные, однако механизм такого кодера "заточен" именно под аудио и раскрывает свой потенциал при кодировании только звуковой информации).
Одним из множества примеров таких кодеров является Monkey's Audio Coder. Коэффициент сжатия этого кодека составляет приблизительно 0.5 - 0.6, что, безусловно, во много раз ниже, чем максимально возможный коэффициент сжатия любого lossy-кодера, однако кодирование данных таким способом обеспечивает их хранение без каких-либо потерь.
Можно ли осуществить преобразование из одного потокового формата аудио данных в другой?
Да, такое преобразование возможно. Если речь идет о цифровых потоках, сжатых специальными lossyалгоритмами (такими как MPEG, WMA, TwinVQ и проч.), то преобразование из одного типа в другой неизбежно влечет за собой потерю качества, так как для преобразования необходимо сначала декодировать исходный поток (качество которого заведомо отличается от оригинала), а затем снова сжать, используя необходимый компрессор (или просто записать в виде абсолютно кодированном виде, иначе говоря, не сжатом). Таким образом, при осуществлении "перекодирования" в новый формат (не в случае простого декодирования в .WAV) происходит фактически двойная потеря качества (относительно качества оригинального сигнала). Под потерей качества следует понимать не только потерю частотных
составляющих в некоторых областях спектра сигнала, но и появление различных дополнительных шумов, помех, а также, потерю информации о сигнале в каналах (потерю оригинального стерео).
Если же речь идет об преобразовании формата хранения абсолютно кодированных данных, то существует большое количество программ-конверторов, позволяющих выполнять такое преобразование. Однако следует учитывать, что, например, конвертирование из PCM в ADPCM по своей сути приводит к ощутимым потерям качества, а при конвертировании данных с понижением разрядности сигнала происходит не только потеря оригинального качества, но и появление шумов. С уровнем шумов можно бороться (например, с помощью дизеринга - добавления псевдослучайного белого шума), однако совсем избавиться от них не удается. Поэтому, лучше по возможности не прибегать к таким преобразованиям. В случаях же, когда конвертирование неизбежно, следует быть предусмотрительным и стараться заранее сохранять звуковые данные в абсолютном виде с максимальным качеством (при максимально возможных параметрах), чтобы процесс конвертирования происходил с минимальными потерями.
Можно ли осуществить преобразование WAV в MIDI, WAV в трекерный модуль?
Другими словами, можно ли преобразовать цифровой поток (будь то .WAV или .SND файл) в файл формата MIDI или трекерный модуль (например, .XM или .IT)? На этот вопрос есть почти однозначный ответ: эта задача не решаема принципиально.
Оцифрованное аудио представляет собой, фактически, набор чисел, описывающих значение амплитуды сигнала в каждый момент времени. MIDI-файл - это принципиально иная структура, где хранятся команды, управляющие генераторами и прочими органами звукового синтезирующего устройства. Трекерный модуль представляет собой набор инструментов (оцифрованных звуков), используемых в данной конкретной музыкальной композиции, и набор команд для управления трекером (то есть набор команд, указывающих последовательность воспроизведения инструментов, а также устанавливающих параметры воспроизведения последних).
Таким образом, для того, чтобы, скажем, преобразовать оцифрованную музыку в формат MIDI необходимо качественно проанализировать весь исходный цифровой поток и однозначно определить, звучание каких инструментов необходимо будет задействовать в выходном MIDI-файле. То есть, фактически необходимо точно идентифицировать инструменты, входящие в композицию. Однако эта проблема, по крайней мере на сегодняшний день, почти не решаема. Посудите сами: для того, чтобы правильно определить звучание какого инструмента происходит в данный момент, нужно, грубо говоря, однозначно знать спектры всех возможных инструментов. И затем, сравнивая спектр звучащего инструмента с набором спектров известных инструментов, определить звучание какого инструмента мы слышим. Но в тоже время мы знаем, что спектр одного и того же инструмента может сильно измениться даже при небольшом изменении силы воздействия на него, а это в свою очередь означает, что однозначно получить спектр мы не можем. Но все сказанное касалось звучания только одного инструмента. А что же будет со спектром сигнала, если в него входит звучание сразу нескольких инструментов? Спектр изменится коренным образом! Вы скажете, что можно, наверное, определить звучание по формантным областям. Да, это возможно, однако говорить все же о точности определения не приходится. Да и проблема-то не заканчивается точной идентификацией инструментов. В дальнейшем придется точно определять тональности звучания, расстановку во времени и тому подобное. По этой причине можно сделать однозначный вывод: качественное преобразование цифровых потоков в MIDI невозможно в принципе.
Справедливости ради нужно сказать, что существует некоторое количество программ, которые позволяют переводить простые одноголосые композиции в MIDI-партитуру.
Можно ли перевести цифровой поток в трекерный модуль? Нет, нельзя по приведенным выше причинам. Более того, так как в трекерных модулях (в отличие от MIDI) хранятся кроме команд и сами используемые в композиции инструменты, то для того, чтобы перевести поток в трекерный модуль, из него нужно вычленить звучание отдельных инструментов. А эта задача равносильна вычленению, например, голоса из песни (караоке). То есть, это возможно в какой-то мере, но
вычленение несомненно будет крайне некачественным, так как спектры инструментов чаще всего наложены друг на друга.
Можно ли выделить из аудио потока звучание конкретного инструмента или голоса?
Такая процедура невозможна принципиально. В целом, существует, конечно, способ выделения голоса (т. н. Karaoke), однако он работает не всегда, и уж тем более не стоит ожидать от него качества. Обычно, голос исполнителя "находится" посредине стерео панорамы. Основываясь на этом, можно попробовать вычесть один канал из другого, удалив таким образом звучащее посредине - на этом механизме основана реализация караоке. Очевидно, что такой способ не дает качественного результата, если дает вообще какой-то результат.
Что же касается вычленения звучания каких-то инструментов, то этот вопрос аналогичен предыдущему (точнее, третий абзац предыдущего вопроса).
Какие существуют способы преобразования MIDI в WAV?
Таких способов много. Попробуем их перечислить.
Если речь идет о переводе в WAV-файл MIDI-композиции с какого-нибудь аппаратного концертного синтезатора, то существует несколько вариантов. Самый простой, вероятно, просто подключить выход синтезатора ко входу звуковой карты компьютера и оцифровать необходимую композицию стандартными методами с помощью какого-нибудь звукового редактора.. Однако этот способ хорош в том случае, если у подключаемого аппарата имеется цифровой выход, а у звуковой карты цифровой вход, так как в этом случае фактически просто произойдет запись цифрового потока с синтезатора в память компьютера, что не повлечет за собой абсолютно никакой потери качества звучания. Если же речь идет об аналоговом соединении аппаратуры, то в таком случае вышеописанный вариант не является удачным, так как внутренние шумы аналоговой части аппаратуры, а также внешние наводки со стороны других устройств могут сильно исказить сигнал и в результате полученный оцифрованный сигнал (.WAV) будет шуметь. Таким образом, если нет возможности осуществить цифровую передачу, можно или удовлетвориться аналоговым соединением или поступить иначе: "перегнать" необходимую MIDI-композицию с синтезатора в компьютер в MIDI-файл и уже MIDI-файл в компьютере доступными средствами оцифровать в .WAV. Однако здесь тоже существуют несколько вариантов.
Для того, чтобы "перегнать" .MID (или файл в ином формате, содержащий MIDI-данные) в .WAV необходимо располагать или звуковой картой со встроенным аппаратным MIDI-синтезатором, или воспользоваться каким-то программным MIDI-синтезатором. Из наиболее распространенных программных синтезаторов можно выделить следующие три: WaveSynth фирмы Creative Labs (поддерживает стандарт GM - General MIDI), Virtual Sound Canvas VSC-88 фирмы Roland (GS - General Synth) и S-YXG100 или S-YXG50 фирмы Yamaha. Следует отметить, что последний качественно отличается от остальных поддержкой стандарта XG (eXtended General). Хотя это тема отдельного обсуждения, следует оговориться все же, что если вы перенесли MIDI-композицию с одного синтезатора и попытаетесь воспроизвести ее на другом (отличном от оригинального), то звучание на нем перенесенной композиции наверняка будет иным (если не абсолютно иным). Эта оговорка особенно касается переноса композиции с концертного синтезатора на компьютер для последующего "перегона" в .WAV, о чем мы говорили выше.
А теперь, собственно, способы преобразования .MID - .WAV. Самый простой и самый "лобовой" - это соединить выход звуковой карты с ее входом, запустить программу для записи (предварительно выбрав устройством записи соответствующего вход) и включить воспроизведение .MID используя аппаратный или программный синтезатор (следует заметить, что такой вариант подключения имеет смысл только если карта полнодуплексная, то есть умеет одновременно воспроизводить и записывать; если нет, то можно установить вторую дополнительную звуковую карту). Однако, если мы говорим об аналоговых входе и выходе, то такой способ просто испортит оригинальное звучание
помехами и шумами, так как фактически сигнал претерпит два лишних взаимообратных преобразования (цифро-аналоговое и аналогово-цифровое) и в придачу наводки на соединительный кабель внесут свои погрешности.
Второй способ аналогичен первому в подходе. Дело в том, что, например, звуковая карта Creative SB Live! позволяет безо всяких физических подключений в качестве устройства записи (входа) использовать, грубо говоря, слышимое в колонках. Иначе говоря, в стандартном микшере Windows в списке устройств записи есть устройство "What U hear" ("То, что ты слышишь"). Самое приятное, что при записи через это устройство сигнал не подвергается цифро-аналоговому и аналоговоцифровому преобразованиям, что исключает влияние наводок и вообще появление каких либо помех, связанных с аналоговым соединением. Таким образом, использование этого устройства записи как нельзя лучше подходит для осуществления перехвата цифровых аудио потоков, в том числе, потоков от программных MIDI-синтезаторов. Для владельцев звуковых плат, отличных от SB Live!, можно порекомендовать воспользоваться, например, такой программой, как Total Recorder. Идея программы аналогична идее устройства "What U Hear" в SB Live!. Эта программа создает в списке устройств для воспроизведения новое виртуальное устройство "Playback through Total Recorder", а также имеет собственную программу записи. Для осуществления преобразования необходимо выбрать это виртуальное устройство как устройство "по умолчанию" для воспроизведения аудио (в Sounds and Multimedia в контрольной панели Windows), запустить программу записи Total Recorder и включить воспроизведение необходимого .MID-файла. Вся прелесть такого способа заключается в том, что сигнал вообще не попадает в аналоговый тракт звуковой карты. Вообще говоря, сигнал даже не попадает на звуковую карту - Total Recorder перехватывает поток идущий на виртуальное устройство "Playback through Total Recorder" и записывает его в файл. Таким образом, с помощью Total Recorder можно произвести оцифровку MIDI-файла абсолютно без потерь качества.
Вариант третий. Как можно заметить, для осуществления оцифровки в предыдущих способах мы предусматривали наличие синтезатора (аппаратного или программного) и звуковой карты. Однако существуют программы специально предназначенные для перевода MIDI в .WAV. Фактически такая программа представляет собой программный MIDI-синтезатор, который подает синтезируемую информацию не на выход звуковой карты, а прямо в файл. Одна из таких программ называется WAVMaker. При использовании для преобразования такой программы наличие какой-либо звуковой аппаратуры теоретически не является необходимостью.
Таким образом, из всех перечисленных методов наиболее подходящий выбирается в зависимости от стоящей задачи. Если преобразование MIDI - .WAV необходимо осуществить максимально качественно, то следует либо воспользоваться цифровым подключением аппаратуры, либо попытаться осуществить преобразование программным путем, не затрагивающим аналоговую часть аппаратуры. Если же требования к качеству преобразования не столь высоки, то можно воспользоваться одним из способов, реализующих конвертирование с помощью аналогового соединения.
Какой метод сравнения двух аудио сигналов можно признать наиболее точным?
Сначала договоримся, что речь идет о сравнении двух сложных непериодических сигналов, представленных в цифровом виде. Далее все зависит от стоящей перед экспериментатором задачи. Вероятно, все сводится к двум вариантам: физическое сравнение двух сигналов (то есть сравнение точности совпадения форм сигналов) и субъективное сравнение, когда целью является оценка "похожести" звучания двух сигналов.
Первый вариант употребим больше при необходимости оценить, например, степень искаженности сигнала, прошедшего какую-либо обработку или передачу по цепям, вносящим помехи. В таком случае сравнение оригинального и искаженного сигналов можно производить, например, путем вычитания одного сигнала из другого (это возможно только в том случае, когда начало и протяженность сигналов во времени точно совпадают) - по результату (результирующему сигналу, полученному путем поотсчетного вычитания одного сигнала из другого) можно приблизительно
оценить уровень потерянной информации (на слух либо проследив изменение спектрального состава сигнала). Также недавно автором одной из статей был предложен иной метод. Берутся два сравниваемых сигнала (в цифровом виде, естественно) и записываются не в абсолютном виде (то есть абсолютные значения амплитуд, PCM - ИКМ - импульсно-кодовая модуляция), а в виде относительного изменения значений амплитуд сигнала (как в ADPCM - АОИКМ - адаптивная относительная импульсно-кодовая модуляция). Другими словами, сигнал записывается значениями, характеризующими изменение значения каждого отсчета относительно предыдущего. Таким образом, в результате проделанной операции получаются, грубо говоря, данные об углах наклона амплитудной огибающей в каждой точке или, что то же самое, информация о виде (форме) сигнала. После такой обработки проводится вычитание одного сигнала из другого (оригинального) и усреднение значении амплитуды полученной разницы. По усредненной величине амплитуды можно судить о потерях, которые сопутствовали сжатию сигнала.
Второй вариант, целью которого является субъективное сравнение разницы в звучании двух сигналов, очень часто применим при оценке качества алгоритмов компрессии аудио. Вообще, целью большинства аудио кодеков (за исключением специализированных, например, вокодеров, кодеков для передачи ограниченного спектра частот и lossless кодеков) является в максимально меньшем объеме данных сохранить аудио информацию как можно более приближенную по качеству к оригинальному звучанию. Другими словами, задача сводится к обеспечению субъективно сходного с оригиналом качества звучания и никак не объективного физического сходства форм (огибающих) оригинального и декодированного сжатого сигналов. В этом случае, применимость описанных выше методов сравнения может быть очень спорна, так как форма сигналов может совпадать очень слабо, а субъективное качество звучания оригинального и восстановленного сжатого сигналов при этом почти не изменится. Тогда для сравнения сигналов можно воспользоваться несколькими разновидностями спектрального анализа, каждый из которых, тем не менее, имеет массу недостатков.
oПервый заключается в графическом сравнении результирующих АЧХ оригинального и восстановленного сжатого сигналов за какой-то промежуток времени. Под понятием "результирующая АЧХ" подразумевается график зафиксированных пиковых значений амплитуд частотных составляющих сигнала за некоторый промежуток времени. Таким образом, взяв два одинаковых промежутка сравниваемых сигналов и построив их результирующие АЧХ, по совпадению (не совпадению) графиков АЧХ можно приблизительно оценить уровень потерянных частотных составляющих в сжатом сигнале, а также увидеть полосы частот, где эти потери наиболее выражены. Однако этот метод является статичным, то есть он абсолютно не учитывает изменение сигналов в динамике, что является очень важным, так как часто встречаются случаи, когда результирующие АЧХ сигналов почти совпадают, однако звучание сравниваемых промежутков сигналов отличается коренным образом даже на слух.
oВторая разновидность спектрального анализа - сравнение сонограмм сигналов (сонограмма - это диаграмма, на которой по оси абсцисс откладывается время, по оси ординат - частота, а амплитуда соответствующей частотной составляющей отмечается интенсивностью цвета в данной точке графика). Сонограмма является более информативной характеристикой, так как позволяет учесть при сравнении изменение сигналов в динамике. Однако этот метод, в отличие от предыдущего, является "слишком графическим", то есть, если при сравнении статических АЧХ имеется возможность оценить "на глаз" разницу графиков, то в случае с сонограммами эта возможность затруднена, так как сравнивать приходится не кривые графиков, а интенсивность цветов на диаграммах. Есть и еще один немаловажный недостаток сонограмм - размытость сигнала во времени, то есть неточное совпадение (отставание либо опережение) спектральной картины с реальным спектральным составом сигнала в каждый конкретный момент времени. Такой феномен обусловлен принципом неопределенности сопутствующим использованию Быстрого Преобразования Фурье (БПФ): чем больше временнОе разрешение спектра, тем меньше спектральное разрешение, и наоборот. При построении сонограммы берутся относительно большие окна для БПФ (промежутки времени, в которых анализируется спектр) и именно это и обуславливает эффект размазывания сигнала. Конечно, появление этого эффекта можно в какой-то мере избежать применяя анализ с перекрывающимися окнами в несколько проходов, однако объем вычислений при этом крайне возрастет и достичь одновременно высоких спектрального и временного разрешений не удастся.
oТретий метод представляет собой более конкретизированный предыдущий, он заключается в построении АЧХ для каждого сканируемого окна БПФ. Однако эта задача не лишена тех же проблем, что и предыдущий метод, и, кроме того, производить сравнение графически крайне