- •1.1.Форматы общего типа
- •2.2. Сжатие m-Law и a-Law
- •2.3. Au
- •2.4. Система сжатия adpcm
- •2.5. Wave
- •2.7. Aiff
- •3. Системы сжатия, основанные на преобразованиях сигналов с использованием mpeg технологии
- •3.1. Основные стандарты mpeg
- •3.2. Mpeg-1 (iso/iec 11172-3)
- •3.3. Mpeg-2 bc (iso/iec 13818-3)
- •3.4. Mpeg-2 Advanced Audio Coding (aac)(iso/iec 13818-7)-
- •3.5. Сравнение mpeg-acc и mpeg-2 bc
- •3.6 Mpeg-4 (iso/iec 14496-3)
- •3.6.1 Что нового содержит mpeg-4 Audio по сравнению с mpeg-2 Audio?
- •3.6.2. Дополнительные функциональные возможности mpeg-4
- •3.6.3. Аудио объекты в mpeg-4
- •3.6.4.Использование mpeg-4 кодер речи (speech coder) вместо itu кодека
- •3.5. A2b music ( based on mpeg acc)
- •3.6.Vqf - (vector quantization format)
- •3.6.1 Размер файлов:
- •3.6.2 Качество звука:
- •3.6.3 Использование cpu:
- •3.6.4 Недостатки:
- •3.6.5 Системные требования:
- •3.6.6 Mp3 против vq. Сравнительная характеристика:
- •3.4.Dolby ac-3
- •3.4.3 Применение ac-3
- •3.6. QDesign Music
- •3.6.1. Обзор
- •3.6.2. Software
- •3.6.3. Преимущества технологии qDesign Music
- •3.6.4. Ограничения
- •3Сводная таблица характеристик:
- •3.7. Aspec
- •4.Методы сжатия речевых сигналов.
- •4.1. Основные типы систем сжатия речи
- •4.2. Некоторые системы кодирования речи на основе стандартов itu-t
- •4.4.InterWave
- •4.5.TrueSpeech
- •4.6. ToolVox for the Web
- •5. Основные форматы аудио данных в Интернете на музыкальных сайтах :
3.6.5 Системные требования:
Windows 95 или NT 40.
Для кодирования:
минимально - Pentium 66, рекомендуется - 200MMX
минимально - 16MB RAM, рекомендуется - 32 и более
Для качественного воспроизведения:
минимально - Pentium 90 (хотя пойдёт и на 75), рекомендуется - 200MMX
16MB RAM.
На практике можно проверить вашу систему так (rule of thumb):
Если Вы можете на своём компьютере гладко (smoothly) проигрыватьmp3 и в то же время запускать что-то ещё, он будет нормально работать и сVQF. Если система с трудом справляется сmp3,VQF, скорее всего, не пойдёт на ней.
3.6.6 Mp3 против vq. Сравнительная характеристика:
Ошибка! Закладка не определена. |
MP3: |
VQ: |
Название: |
MPEG (Motion Pictures Expert Group) Layer 3 (Группа Экспертов Кинокартин) |
Transform-domain Weighted Interleave Vector Quantization Векторная квантификация взвешенной последовательности области преобразования (сокращённо TwinVQ) |
Информа-ция: |
Разработан некоммерческой организацией, запатентован, хотя имеет некоторые проблемы (для разработчиков). Кроме того, различные программы имеют на выходе различное качество и т.д. |
Разработан как коммерческий стандарт, хотя всё ПО распространяется абсолютно свободно. |
Размер файлов: |
Около 4MB на 4-минутный файл на 128kbps. Хорошее качество. |
Около 3MB на 4-минутный файл на 96kbps. Качество лучше, чем у 128kbps MP3. |
Коэффици-ент сжатия: |
Обычно 1:12 |
1:18 (обычно) и лучше |
Технология сжатия: |
Из WAV или RAW файла в MP3 |
Из WAV или RAW файла в VQF
|
Загрузка CPU при декодирова-нии (K6-233): |
Около 20% |
Около 30%*
|
Примечание: * означает, что это и подразумевалось: VQF создавался для более мощных процессоров, чем mp3 и, следовательно, коэффициент использования CPU выше. Упаковка больших объёмов в меньшие пространства требует большей производительности от CPU. Тем не менее, любой компьютер, произведённый в последние годы, сможет воспроизводить VQF файлы.
3.4.Dolby ac-3
3.4.1. Что такое AC-3? AC-3 (Audio Code – аудио код номер 3) относится к технологии компрессии многоканальной музыки (multichannel music compression), созданной в лаборатории Dolby. Цель этого цифрового сжатия – создать двоичное представление аудио-сигнала, который после декодирования звучал бы как исходный с использованием минимума цифровой информации (скорость потока данных) для сжатого (кодированного) представления, создавая естественный окружающий звук (surround sound).
В последние несколько лет лаборатория Dolby использовала термин Dolby Digital для цифровых систем, используемых в театрах и кинотеатрах и Dolby Surround AC-3 для рынка ‘домашних кинотеатров’. На практике и большое кино и домашний кинотеатр имеют в основе одну и ту же технологию (немного отличаются скорости потока данных). Поэтому, чтобы избежать путаницы, компания решила обозначить для потребителей многоканальный цифровой формат как Dolby Digital.
Рис 3. AC-3 поддерживает количество каналов от 1 до ‘5.1’. Он предоставляет пять полнодиапазонных (от 3 Hz до 20,000 Hz) каналов и, поэтому, иногда обозначается как конфигурация ‘3/2’: 3 фронтальных канала (слева, по центру и справа) плюс 2 surround канала. Шестой канал, предназначенный специально для басов (от 3 Hz до 120 Hz), называется также ‘улучшенный канал низких частот’ (“low frequencies enhancement channel - LFE”). Наличие LFE и привело к возникновению термина “5.1 каналов”. Поскольку AC-3 в основном предназначен для создания surround эффекта, он включает также информацию о размерах помещения и разность уровней (в дБ) между каналами (differences in dB between the channels levels).
3.4.2. Как работает AC-3? Как и mp3 или AAC, AC-3 использует шаблонные свойства (masking properties) звука для сжатия. Входные несжатые PCM выборки должны быть 32, 44.1 или 48 kHz при размере до 20 bit. Рис 4.
PCM Time Samples |
Временные выборки PCM |
|
Bit Allocation Information |
Информация о размещении бит |
Analysts Filter Bank |
Банк анализирующих фильтров |
|
Mantissa Quantization |
Квантование мантиссы |
Exponents |
Показатели |
|
Quantified Mantissas |
Квантованная мантисса |
Spectral Envelope Encoding |
Создание огибающей спектра |
|
Encoded Spectral Envelope |
Огибающая спектра |
Bit Allocation |
Размещение бит |
|
AC-3 Frame Formatting |
Преобразование в AC-3 фрейм |
Mantissas |
Мантиссы |
|
Encoded AC-3 BitStream |
Кодированный AC-3 поток данных |
Первый шаг при кодировании – преобразовать представление аудио в виде последовательности временных выборок PCM в последовательность спектров (frequencies coefficients blocks). Это осуществляется в банке анализирующих фильтров. Перекрывающиеся блоки по 512 выборок, мультиплексированных во временном окне, преобразуются в частотный домен. Из-за перекрытия блоков каждая входнаяPCMвыборка представлена в двух идущих друг за другом преобразованных блоках. Представление в виде частотного домена может быть затем сжато в 2 раза так, что каждый блок будет содержать 256 частотных коэффициентов. Каждый из этих частотных коэффициентов представляется в экспоненциальной форме – в виде двоичных мантиссы и порядка.
Набор экспонент (порядков) кодируется в грубое (приближённое) представление спектра сигнала, которое называется “спектральной огибающей”.
Эта спектральная огибающая используется в процедуре, определяющей, сколько бит необходимо для кодирования каждой конкретной мантиссы
Мантисса квантуется в соответствии с информацией о размещении бит
Огибающие спектра и грубо (приближённо) квантованные мантиссы для 6 аудио блоков (1536 выборок) преобразуются в AC-3 фрейм.
AC-3 поток данных (от 32 до 640kbps) – последовательностьAC-3 фреймов.