- •Список сообщений
- •Треки и клипы
- •Sweet Spot
- •Частотная характеристика
- •Ушная раковина (Pinna)
- •Неподвижные источники звука
- •Каково же будет решение?
- •Хорус как таковой
- •Хорус в Cool Edit Pro 2
- •Хорус в SONAR 2.1
- •Простые методы сжатия
- •Методы сжатия, основанные на психоакустике
- •Некоторые факты о восприятии звука
- •Транзиентные сигналы
- •1. Оцифровка звука и его хранение на цифровом носителе
- •2. Преобразование звука из цифрового вида в аналоговый
- •3. Способы хранения цифрового звука
- •4. Преимущества и недостатки цифрового звука
- •5. К вопросу об обработке звука
- •6. Аппаратура
- •7. Программное обеспечение
- •8. Перспективы и проблематика
- •Глоссарий терминов
- •Уровень и динамический диапазон звукового сигнала
- •Устройства динамической обработки
- •Структура устройств динамической обработки
- •Временные характеристики
- •Уровень и динамический диапазон звукового сигнала
- •Устройства динамической обработки
- •Структура устройств динамической обработки
- •Временные характеристики
- •Дилэй и эхо - близнецы-братья
- •Дилэй и эхо в Cool Edit Pro 2
- •Дилэй в SONAR 2
- •Дилэй в Cubase SX
- •FFT фильтр
- •IIR фильтры
- •FIR фильтры
- •Введение
- •Wave файл с компрессией ADPCM
- •MPEGplus/Musepack (MP+/MPC/MPP)
- •TwinVQ (VQF)
- •Liquid Audio
- •OGG Vorbis
- •Качество Звучания
- •Заключение
- •Глоссарий:
- •Полезные ссылки:
- •Создаем аудиотрек
- •Выбираем порт ввода звуковых данных
- •Выбираем порт вывода
- •Чтобы не работать впустую
- •Регулируем уровень сигнала
- •Спет куплет
- •Словарик
- •Классический спектр
- •Текущий спектр
- •Мгновенный спектр
- •Отображение мгновенного спектра
- •Сколько весит спектр?
- •Список сообщений
- •Треки и клипы
- •Audio-CD
- •Что влияет на качество воспроизведения Audio-CD?
- •Является ли CD-R, переписанный с обычного CD, точной копией исходного диска?
- •Чем, в таком случае, отличается привод CD-R[W] за $2.000 от привода за $200?
- •Можно ли получить абсолютную копию звука Audio-CD в обычный wav-файл ("сграбить" - англ. "grab")?
- •Какой грабер лучше использовать?
- •Формат сжатия MP3 - общие вопросы
- •Откуда у тебя такая любовь к кодеру Producer 2.1?
- •Если ты даже не смотрел {MP3enc, Lame, Bladeenc, OGG Vorbis, *.* AAC, впишите_сюда_своё}, то почему ты уверен, что Producer 2.1 лучше всех?
- •Всё же, какой кодер самый крутой?
- •Ты совсем не упомянул кодер <n>!
- •Можно ли отличить MP3-256 от оригинала на слух?
- •??? Я всегда считал, что MP3-256 неотличим на слух от оригинала?
- •Может быть, еще увеличить поток поможет? Как насчет MP3-320?
- •А можно ли отличить MP3-256 от оригинала, сравнивая их таким же интенсивным образом, но в слепом тесте?
- •Значит, отличить всё же можно. Почему тогда ты говоришь в своей статье - 'MP3-256 не изменяет параметры звука хоть сколь заметным человеку образом'?
- •Так в каком же случае можно считать MP3-256 оригиналом?
- •Ну и чем кодировать в MP3-256?
- •Немного философии
- •Тебя не смущает, что все твои записи закодированы в MP3-256, и в один прекрасный момент ты обнаружишь их некачественность?
- •Я понял - тебя просто не волнует качество звука. Может, ты просто не слышишь разницы?
- •Если MP3-256 оставляет, как ты говоришь, практически оригинал, можно ли использовать его в студии?
- •Что такое MP3 ?
- •Детали
- •Настоящее и будущее MP3
- •Описание процесса кодирования
- •Подготовка к кодированию. Фреймовая структура
- •Начало кодирования
- •Работа психоакустической модели.
- •Завершение кодирования
- •Замечание
- •Способы кодирования стерео сигнала
- •Простые заблуждения и ошибки, делаемые пользователями MP3
- •Немного о программах
- •Немного о некоторых битрейтах
- •VBR & XingTech
- •Способы хранения MP3
- •Характер потерь при кодировании
- •Тестирование качественности кодеров
- •Психоакустическая модель и разные битрейты
- •Какие, собственно, кодеры у нас в распоряжении
- •Всякое-разное
- •Что такое front-end ?
- •Что такое ACM pro codec ( MP3-кодек ) ?
- •Файлы какого формата можно перевести в формат MP3?
- •Каков статус MP3 кодеров?
- •Каковы системные требования ?
- •Выводы
- •Чем компьютер может помочь в работе над музыкой?
- •Насколько качественно компьютер исполняет и обрабатывает музыку?
- •Можно ли делать всю музыку только на компьютере?
- •Что выбрать - трекер или синтезатор с секвенсором?
- •Где можно найти информацию по работе над музыкой?
- •Кратко об истории и характеристиках стандартов MPEG
- •Что такое CBR и VBR?
- •Каковы отличия режимов CBR, VBR и ABR? (применительно к кодеру Lame)
- •Какие методы кодирования стерео информации используются в алгоритмах MPEG (и других)?
- •Какие параметры предпочтительны при кодировании MP3?
- •Какие алгоритмы компрессии существуют (альтернативы MP3 и др.)?
- •кодирование с потерями качества / lossy coding
- •кодирование без потерь качества / lossless coding
- •Можно ли осуществить преобразование из одного потокового формата аудио данных в другой?
- •Можно ли осуществить преобразование WAV в MIDI, WAV в трекерный модуль?
- •Можно ли выделить из аудио потока звучание конкретного инструмента или голоса?
- •Какие существуют способы преобразования MIDI в WAV?
- •Какой метод сравнения двух аудио сигналов можно признать наиболее точным?
- •Что такое стеганография?
- •Clip Restoration - алгоритм, функционирующий на грани мистики
- •Noise Reduction - шумоподавитель идет по следу
- •Альфа. Программы
- •Бета. Постановка задачи
- •Гамма. Подготовка к восстановлению
- •Дельта. Два способа
- •Дзета. Стерео и дорожки. Щелчки и винил
- •Эта. Фильтрация
- •Тэта. Вычитание или подавление?
- •Иота. Многополосная фильтрация
- •Каппа. Sono luminus
- •Лямбда. Полуфинал
- •Ми. Финал
- •Омега. Суперфинал
- •Графический эквалайзер
- •Параметрический эквалайзер
- •Практикум
- •Кроссовер
- •Совет 1 - Surround stereo, типа.
- •Совет 2 - Кайфные Ведущие.
- •Совет 3 - Эффективное Панорамирование.
- •Совет 4 - Попадаем в Качание вселенского маятника.
- •Предисловие к "ничему"
- •Пики и Впадины
- •Мелодия
- •Groove? Что за Groove?
- •Мля. Только не C, Dm, F, G
- •Последнее, но немаловажное
- •Выразительные средства музыкального языка
- •Динамическое развитие
- •Темповое развитие
- •Мелодическое развитие
- •Ритмическое развитие
- •Тембровое развитие
- •Имитация акустической среды
- •Звуковые эффекты
- •Вибрато
- •Амплитудное вибрато и тремоло
- •Частотное вибрато
- •Тембровое вибрато
- •Немного анатомии (устройство уха - коротко и ясно)
- •О чувствительности (по мощности и частотной)
- •О фазовой чувствительности
- •Об объемном восприятии
- •О нотах и октавах. Гармоники
- •1. Способы преобразования звука
- •2. Звуковые эффекты
- •Использование задержки
- •Преобразование амплитуд
- •Частотные преобразования
- •Использование эффекта реверберации в профессиональных приложениях
- •Сущность эффекта реверберации
- •История искусственной реверберации
- •Цифровые ревербераторы
- •Типы реверберации
- •Параметры реверберации
- •Управление реверберацией по MIDI
- •Способы практического использования
- •Компрессоры и компрессия
- •Оживление искусственных барабанов
- •Советы по эквализации музыкальных инструментов
- •Практика записи
пользователю возможность работы с тегами и декодирования файла в WAV (с целью последующей записи на CD-R/CD-RW диск) обычно дороже защиты музыкального файла и сомнительного выигрыша в размере. На данный момент единственным аргументом в пользу WMA являются наличие аппаратных проигрывателей, все же остальные «достоинства» формата носят исключительно рекламный характер.
Примерно то же самое можно сказать и о LQT: он хорош для звукозаписывающих студий, выкладывающих демонстрационные записи в Интернет; рядовому пользователю его использование может доставить немало проблем.
AAC еще не получил достаточного распространения, хотя имеет немалые перспективы, особенно учитывая поддержку формата со стороны крупнейших компаний.
OGG Vorbis только начал набирать популярность, хотя уже на данный момент он имеет значительное число поклонников. Данный формат можно порекомендовать всем, для кого размер итогового файла имеет решающее значение.
Musepack, - не слишком популярный, но весьма неплохой формат для хранения высококачественной музыки может успешно заменить MP3 любителям качественного звука, позволяя добиться непревзойденных результатов. На данный момент Musepack является форматом, позволяющим добиться максимально высокого качества при использовании сжатия с потерями.
Что же касается wav файлов, сжатых кодеком ADPCM, то использование этого кодека для хранения музыки крайне нежелательно.
Глоссарий:
Битрейт (bitrate) – количество бит, необходимых для кодирования 1 секунды звука. Так, битрейт несжатого файла формата 44.1КГц 16 бит, стерео (компакт диск) будет 16*44100*2=1411200 или
1411.2 кб/с (kbps)
Частота дискретизации, частота выборки (sample rate, sampling rate) При преобразовании аналогового звука в цифровой сигнал сэмплируется, т.е. преобразуется в дискретные значения, диапазон значений для 16 бит будет от –32768 до 32767.
Кодирование с постоянным битрейтом (CBR, constant bitrate) – режим кодирования, при котором битрейт остается неизменным независимо от характера музыки. Основной задачей кодировщика в этом случае будет необходимость получения максимально высокого качества файла при неизменном потоке.
Кодирование со средним битрейтом (ABR, average bitrate) - режим кодирования, промежуточный между CBR и VBR. При кодировании указывается желаемый средний битрейт. В случае необходимости кодировщик может немного повышать битрейт или понижать его, позволяя добиться более высокого соотношения качество/размер. Недостатком режима ABR является более низкое качество, чем получаемое в VBR режиме. Достоинством – более-менее однородный поток и как следствие – легко предсказуемый размер файла.
Кодирование с переменным битрейтом (VBR, variable bitrate) – режим кодирования, при котором кодировщику задается желаемый уровень качества. При кодировании кодек сам выбирает необходимый битрейт для сжатия каждого фрагмента записи, при этом диапазон используемых битрейтов может быть очень большим. Данный режим позволяет добиться максимального соотношения качество/размер, однако размер итогового файла часто сложно предсказать (например, при сжатии musepack –normal средний битрейт файла может быть как 140, так и 210). Недостатком VBR является невозможность использования его для Интернет трансляций при малой ширине канала.
Joint Stereo – один из способов кодирования стереосигнала, при котором учитываются схожесть сигналов правого и левого каналов. Правильно спроектированная модель JS позволяет получить более высокие результаты, чем кодирование каждого из каналов отдельно.
SBR (spectral band replication) – технология, позволяющая восстанавливать высокие частоты за счет информации, содержащийся в других областях спектра и небольшого потока дополнительных данных. Позволяет повысить качество звучания файлов при использовании низких битрейтов.
DRM (digital rights management) – набор средств, призванных защитить запись от нелегального копирования.
Артефакт (artifact) – посторонние звуки и искажения, возникающие в процессе кодирования записи. Наличие артефактов и искажений обусловлено несовершенством психоакустических моделей кодировщиков.
Преэхо (preecho) - артефакт, часто отчетливо слышимый при кодировании четких резких звуков (например, звука хайхэтов ударных установок). Проявляется в том, что эхо появляется перед звуком, вызвавшим его.
Пресет (preset) – Современные кодировщики могут быть достаточно сложны в настройке (например, lame или psytel). Для того, чтобы избавить пользователя от необходимости запоминать длинные последовательности ключей и параметров, необходимых для создания файла большинство современных кодировщиков имеет пресеты: заранее заготовленные и оптимизированные наборы установок, которые гораздо легче запомнить. Например, пресет r3mix соответствует следующиму набору параметров командной строки lame: “ --nspsytune --vbr-mtrh -V1 -mj -h -b96 --lowpass 19.5 -- athtype 3 --ns-sfb21 2 -Z --scale 0.98 ”
ABX тест – один из способов сравнения файлов, сводящий к минимуму случайные совпадения и исключающий влияние так называемого «эффекта пустышки». См. www.pcabx.com для получения подробной информации по методике тестирования.
Полезные ссылки:
•http://www.mp3dev.org/ - сайт, на котором можно найти немало полезной информации по технологиям сжатия звука, базирующихся на стандартах MPEG: MP3, AAC, VQF.
•http://www.mp3prozone.com/ - сайт, посвященный формату mp3pro.
•http://www.xiph.org/ - сайт, на котором можно найти много информации по новому формату ogg vorbis.
•http://www.stud.uni-hannover.de/%7eandbusch/audiocoder_eng.html - страничка разработчика формата mpegplus, содержащая подробную информацию о данном формате.
•http://www.Musepack.org - неплохой сайт для начального знакомства с форматом Musepack.
•www.r3mix.net - сайт, посвященный различным технологиям сжатия звука. Хорошая подборка ссылок на другие ресурсы. Сайт достаточно давно не обновлялся, но его материалы все еще актуальны.
•http://www.inf.ufpr.br/~rja00/ - rare wares - множество бесплатных программ для кодирования музыки, которые не всегда легко найти в других источниках: кодировщики и декодировщики различных форматов, графические оболочки (фронтенды) к популярным кодировщикам и т.д.
•www.hydrogenaudio.org - лучший форум, посвященный различным технологиям кодирования звука. В форуме часто можно встретить достаточно известных людей, например Peter Pawlowski, автора множества плагинов к Winamp 2/3.
Автор выражает благодарность Илье Палопеженцеву за помощь в подготовке материала.
Рассмотрим интересную и очень познавательную проблему - умножение частот колебаний в
аналоговой схеме. Это приходится делать довольно часто. А как это сделать? Я, помнится, в детстве часто задавался этим вопросом. И не мог придумать вразумительного ответа... Меня в очередной раз попросили объяснить, и я подумал - вдруг, даже наверняка, это покажется кому-то любопытным?
Прежде всего, надо взять саму частоту. Допустим, 100 герц.
Будем умножать. Второй шаг довольно оригинален - я, помнится, сильно радовался, когда узнал его принцип: вносим в сигнал искажения. В обычной аналоговой схеме для этого применяется любой нелинейный элемент - например, диод. Я применяю эмуляцию включения диода параллельно сигналу - он не пропускает ток даже в прямом направлении (т.е. в нашем случае не искажает сигнал) до определенной амплитуды (т.е. до определенного напряжения на нем), но начинает пропускать его после некой точки. Кстати, специфический диод, используемый в таком режиме, называется стабилитрон - средство ограничения напряжения на определенном уровне. Короче говоря, срубили сигнал выше определенного уровня - весь "излишек" стекает через диод:
Таким образом мы получили сильные гармонические искажения сигнала - то, чего стараются избегать в звуковых схемах. Появились четные гармоники исходной частоты - т.е. частоты 200 Гц, 300 Гц и т.д. Мы уже умножили! Умножитель частоты - на единственном диоде. Одна проблема - непонятно, на сколько, собственно, умножили. Частот у нас получилось до чертиков - и нужных, и не нужных:
Теперь надо решить, на сколько мы будем умножать. Вот я пометил на рисунке вторую гармонику - то есть мы будем умножать на два. Например. И тут вскрывается сильное ограничение элементарных умножителей частот - они работают лишь в определенном диапазоне. Поясняю: наш следующий шаг - построить фильтр, который уберет все частоты, кроме красного отрезка (на рисунке). Но сам этот фильтр рассчитан на определенный диапазон результирующих частот. Т.е. если мы вместо частоты 100 Гц дадим на вход 103 Гц, то на выходе, как и нужно, получится ровно 206 Гц - т.е. главное условие, синхронность исходной частоте, выполнено. А вот если дадим 201 Гц - он вообще не будет умножать, так и оставит 201 Гц. Если подать 49 Гц - то умножит на четыре вместо двух, дав нам 196 Гц. Т.е. он будет выдавать ту гармонику, которая попала в результирующий диапазон, а какая она по счету - не важно. Может быть, в этот диапазон вообще ничего не попадет - тогда на выходе будет тишина.
Я взял простейший фильтр, который полностью соответствует аналоговому фильтру - фильтр второго порядка Bessel, и оставил частоты от 180 до 220 Гц:
Это очень халявная фильтрация, и, несмотря на это, получились вполне сносной формы синусоиды :). Вывод - моя комбинация действий умножает частоту, лежащую в рамках от 90 до 110 Гц, ровно в два раза (до 180 - 220 Гц), причем частота получается хорошо синхронизированной по фазе с исходной - ровно то, что нужно в цифровых схемах. На реализацию такой штуки в аналоговой схеме потребуется: диод и два простейших активных фильтра - два транзистора, несколько резисторов и конденсаторов. Элементарный умножитель частоты строится на десятке простейших аналоговых элементов!
А если стоит задача умножить на десять? На сто? Смотрите на спектр - сотая гармоника слишком слаба. Эта проблема очень даже актуальна - есть такой элемент, называется кварцевый резонатор. Кварц в просторечии. Единственный дешевый способ получить некую фиксированную частоту с большой точностью. Он, будучи включенным в контур, выдает тактовые колебания с частотой, к примеру, 14.31816 мГц, а Pentuim III работает на частоте 800 мГц. А таких кварцев нет... Умножить надо в полусотню раз. На самом деле эта проблема имеет еще более простое решение. Есть такое