- •2.4.3 Ацп с плавающей точкой……………………………………………
- •1 Цифровые фильтры
- •1.1 Явление Гиббса
- •1.1.1 Сущность явления Гиббса
- •1.1.2 Параметры эффекта
- •1.1.3 Последствия для практики
- •1.2 Весовые функции
- •1.2.1 Нейтрализация явления Гиббса в частотной области
- •1.2.2 Основные весовые функции
- •1.3 Типы фильтров
- •1.4 Разностное уравнение
- •Нерекурсивные фильтры
- •1.5.1 Методика расчетов нцф
- •1.5.2 Идеальные частотные фильтры
- •1.5.3 Конечные приближения идеальных фильтров
- •1.5.3.1 Применение весовых функций
- •1.5.3.2 Весовая функция Кайзера
- •1.5.4 Дифференцирующие цифровые фильтры
- •1.5.5 Гладкие частотные фильтры
- •1.6 Рекурсивные фильтры
- •6.3 Интегрирующий рекурсивный фильтр.
- •1.6.1 Принципы рекурсивной фильтрации
- •1.6.2 Режекторные и селекторные фильтры
- •1.6.2.1 Комплексная z-плоскость.
- •1.6.2.2 Режекторные фильтры
- •1.6.2.3 Селекторный фильтр
- •1.6.3 Билинейное z-преобразование
- •1.6.4 Типы рекурсивных частотных фильтров
- •1.7 Импульсная характеристика фильтров
- •Передаточные функции фильтров
- •1.9 Частотные характеристики фильтров
- •1.10 Частотный анализ цифровых фильтров
- •1.10.1 Сглаживающие фильтры и фильтры аппроксимации
- •1.10.1.1 Фильтры мнк 1-го порядка (мнк-1)
- •1.10.1.2 Фильтры мнк 2-го порядка (мнк-2)
- •1.10.1.3 Фильтры мнк 4-го порядка
- •1.10.2 Разностные операторы
- •1.10.2.1 Разностный оператор
- •1.10.2.2 Восстановление данных
- •1.10.2.3 Аппроксимация производных
- •1.10.3 Интегрирование данных
- •1.10.4 Расчёт фильтров по частотной характеристике
- •1.11 Фильтрация случайных сигналов
- •1.12 Структурные схемы цифровых фильтров
- •Обращенные формы.
- •1.13 Фильтры Чебышева
- •1.14 Фильтры Баттерворта
- •Свойства фильтров Баттерворта нижних частот:
- •1.15 Фильтры Бесселя
- •2 Аналого-цифровое преобразование
- •2.1 Цифровая обработка звуковых сигналов
- •2.2 Основы аналого-цифрового преобразования
- •2.2.1 Основные понятия и определения
- •2.3 Структура и алгоритм работы цап
- •Контрольные вопросы
- •2.4 Структура и алгоритм работы ацп
- •2.4.1 Параллельные ацп
- •2.4.2 Ацп с поразрядным уравновешиванием
- •2.4.3 Ацп с плавающей точкой
- •Контрольные вопросы
- •Глава 3. Звук.
- •3.1 Аудиосигнал
- •3.1.1 Звуковые волны
- •3.1.2 Звук как электрический сигнал
- •3.1.3 Фаза
- •3.1.4 Сложение синусоидальных волн
- •3.2 Звуковая система
- •3.2.1 Назначение звуковой системы
- •3.2.2 Модель звуковой системы
- •3.2.3 Входные датчики
- •3.2.4 Выходные датчики
- •3.2.5 Простейшая звуковая система
- •3.3 Амплитудно-частотная характеристика
- •3.3.1 Способы записи ачх в спецификации звуковых устройств
- •3.3.2 Октавные соотношения и измерения
- •3.3.3 Ачх реальных устройств воспроизведения звука
- •3.3.4 Диапазон частот голоса и инструментов
- •3.3.5 Влияние акустических факторов
- •3.4 Единицы измерения, параметры звуковых сигналов
- •3.4.1 Децибел
- •3.4.2 Относительная мощность электрических сигналов дБm
- •3.4.3 Децибелы и уровень звука
- •3.4.5 Громкость, уровень сигнала и коэффициент усиления
- •3.4.6 Громкость
- •3.5 Динамический диапазон
- •3.5.1 Запас динамического диапазона
- •3.5.2 Выбор динамического диапазона для реальной звуковой системы
- •3.6 Цифровой звук
- •3.6.1 Частота дискретизации
- •3.6.2 Разрядность
- •3.6.3 Дизеринг
- •3.6.4 Нойс шейпинг
- •3.6.5 Джиттер
- •3.7 Методы и стандарты передачи речи по трактам связи, применяемые в современном оборудовании (7 кГц)
- •3.7.1 Импульсно-кодовая модуляция (pcm — Pulse-Code Modulation)
- •3.7.3 Помехоустойчивость методов икм
- •3.7.4 Методы эффективного кодирования речи
- •3.7.5 Кодирование речи в стандарте cdma
- •3.7.6 Речевые кодеки для ip-телефонии
- •3.7.7 Оценка качества кодирования речи
- •3.8 Общие сведения по мр3
- •3.8.1 Феномен мрз
- •3.8.2 Что такое формат мрз?
- •3.8.3 Качество записи мрз
- •3.8.4 Формат мрз и музыкальные компакт-диски
- •3.8.5 Работа со звукозаписями формата мрз
- •3.9 Основные понятия цифровой звукозаписи
- •3.9.1 Натуральное цифровое представление данных
- •3.9.2 Кодирование рсм
- •3.9.3 Стандартный формат оцифровки звука
- •3.9.4 Параметры дискретизации
- •3.9.5 Качество компакт-диска
- •3.9.6 Объем звукозаписей
- •3.9.7 Формат wav
- •3.10 Формат mp3
- •3.10.1 Сжатие звуковых данных
- •3.10.2 Сжатие с потерей информации
- •3.10.3 Ориентация на человека
- •3.10.4 Кратко об истории и характеристиках стандартов mpeg.
- •3.10.5 Что такое cbr и vbr?
- •3.10.6 Каковы отличия режимов cbr, vbr и abr?
- •3.10.7 Методы оценки сложности сигнала
- •3.10.8 Какие методы кодирования стерео информации используются в алгоритмах mpeg (и других)?
- •3.10.9 Какие параметры предпочтительны при кодировании mp3?
- •3.10.10 Какие альтернативные mpeg-1 Layer III (mp3) алгоритмы компрессии существуют?
- •3.11 OggVorbis
- •3.13 Flac
- •4 Сжатие видео
- •4.1 Общие положения алгоритмов сжатия изображений
- •4.1.1 Классы изображений
- •4.1.2 Классы приложений
- •4.1.3 Требования приложений к алгоритмам компрессии
- •4.1.4 Критерии сравнения алгоритмов
- •4.2 Алгоритмы сжатия
- •Gif (CompuServe Graphics Interchange Format)
- •4.3 Вейвлет-преобразования
- •4.3.1 Вейвлеты, вейвлет-преобразования, виды и свойства Вейвлет анализ и прямое вейвлет-преобразование
- •Непрерывное прямое и обратное вейвлет-преобразования
- •Ортогональные вейвлеты
- •Дискретное вейвлет-преобразование непрерывных сигналов
- •Кратномасштабный анализ
- •Пакетные вейвлеты.
- •4.3.2 Примеры применения вейвлетов Очистка сигнала от шума
- •Очистка сигнала от шумов на основе вейвлет-преобразований.
- •4.4 Формат сжатия изображений jpeg
- •2) Дискретизация
- •3) Сдвиг Уровня
- •4) 8X8 Дискретное Косинусоидальное Преобразование (dct)
- •5) Зигзагообразная перестановка 64 dct коэффициентов
- •6) Квантование
- •7) RunLength кодирование нулей (rlc)
- •8) Конечный шаг - кодирование Хаффмана
- •4.5 Jpeg2000
- •4.5.1 Общая характеристика стандарта и основные принципы сжатия
- •4.5.2 Информационные потери в jpeg2000 на разных этапах обработки
- •4.5.3 Практическая реализация
- •4.5.4 Специализированные конверторы и просмотрщики
- •4.5.5 Основные задачи для развития и усовершенствования стандарта jpeg2000
- •4.6 Видеостандарт mpeg
- •4.6.1 Общее описание
- •4.6.2 Предварительная обработка
- •4.6.3 Преобразование макроблоков I-изображений
- •4.6.4 Преобразование макроблоков р-изображений
- •4.6.5 Преобразование макроблоков в-изображений
- •4.6.6 Разделы макроблоков
- •4.7 Mpeg-1
- •Параметры mpeg-1
- •4.8 Mpeg-2
- •4.8.1 Стандарт кодирования mpeg-2
- •4.8.2 Компрессия видеоданных
- •4.8.3 Кодируемые кадры
- •4.8.4 Компенсация движения
- •4.8.5 Дискретно-косинусное преобразование
- •4.8.6 Профессиональный профиль стандарта mpeg-2
- •4.9.11 Плюсы и минусы mpeg-4
- •4.10 Стандарт hdtv
3.10.7 Методы оценки сложности сигнала
Таким образом, основное отличие CBR, ABR и VBR состоит в использовании разных методов подсчёта необходимого для кодирования каждого фрейма количества бит.
Методы оценки сложности сигнала: метод 1 (VBR)
Первый метод основан на вычислении "психоакустической маскировки" и "ошибки кодирования". Этот метод используется в VBR и теоретически должен был бы давать максимальное качество если бы психоакустическая модель Lame была идеальна. В основе этого метода лежит очень простая идея: на кодирование выделяется минимальное количество бит, необходимое для выполнения условия: [ошибка_кодирования] < [порога_маскировки] (то есть дефекты кодирования должны маскироваться основным сигналом и не должны быть различимы на слух).
Пояснение по поводу маскировки. Основная масса "аудио компрессоров с потерями" использует для сжатия аудио сигнала особенности человеческого слуха (в противовес существуют аудиокомпрессоры использующие особенности звукоизвлечения), а именно его неидеальность. Можно указать несколько основных "дефектов" слуха используемых в сжатии звука: 1) ограниченный динамический диапазон. Человек не слышит слабых сигналов или, иначе говоря, существует некий порог слышимости. 2) громкие сигналы (особенно шумовые, а не тональные) обладают маскирующим действием, при чем как во временной, так и в частотной области, т.е. любой мощный, особенно шумовой сигнал определённой частоты маскирует достаточно слабый сигнал, особенно если он лежит в близком частотном диапазоне и такой замаскированный сигнал можно не кодировать, ведь человек его не слышит. Порог маскировки может быть увеличен на несколько децибелл путем уменьшения качества кодирования (объяснение этому: чем хуже качество кодирования, тем больше артефактов и помех в звучании, и тем более мощный сигнал необходим, чтобы замаскировать эти помехи).
Плюс такого метода: теоретически максимальное качество. Минусы: невысокая скорость а также то, что из-за не идеальности психоакустической модели в Lame, постоянно занижается битрейт, соответственно не рекомендуется использовать без фиксированной нижней границы около 112- 128 кБ/с, а, следовательно, режим VBR вообще не рекомендуется использовать на низких и средних битрейтах. Резервуар в VBR минимизирован, а следовательно не рекомендуется использовать ограничение битрейта сверху (объяснение: так как практически резервуара в VBR нет, если ограничить битрейт сверху, то некоторым фреймам со "сложной" музыкой может оказаться недостаточно бит для кодирования звука, поскольку дополнительные биты взять неоткуда , резервуара нет и битрейт ограничен; такие фреймы будут кодироваться только тем количеством бит, которое имеется в наличии - то есть на максимально допустимом битрейте, что может привести к плохому качеству кодирования).
Методы оценки сложности сигнала: метод 2 (ABR / CBR)
Второй метод основан на вычислении Perceptual Entropy (PE), характеризующей сложность кодируемого сигнала (чем сложнее сигнал, тем PE больше). Этот метод используется при кодировании CBR и ABR. Механизм расчета сложности сигнала с помощью PE полностью отличается от механизма, использованного в VBR. Не вдаваясь глубоко в подробности следует сказать, что если в первом методе расчет сложности сигнала проводился опираясь на свойства маскировки, то в данном методе сложность сигнала оценивается путем попытки его предсказания: чем более сложный сигнал (огибающая ведет себя хаотично), тем труднее он предсказуем и, соответственно, тем больше бит требуется для кодирования сигнала. Во время кодирования кодер пытается предсказать сигнал, затем сравнивает предсказанный сигнал с оригиналом, чем менее предсказанный сигнал совпадает с оригиналом, тем больше бит уходит на кодирование. Очень важно отметить, что используемые методы вычисления сложности сигнала принципиально влияют на отличия использующих их механизмов. Так, принципиальная разница между ABR/CBR (использующих описываемый метод) и VBR (который использует метод 1, описанный выше) заключаются еще и в том, что выбор битрейта в ABR/CBR лежит не на кодере, а на пользователе, при этом Lame лишь добавляет/отнимает небольшое количество бит во время кодирования сложных/простых мест соответственно (для чего и рассчитывается PE). Другими словами, в зависимости от рассчитанного PE, к выбранному пользователем битрейту добавляется (или отнимается от него) нужное число бит, что реализуется с помощью механизма работы с резервуаром (виртуальным или настоящим). Таким образом, при использовании второго метода именно пользователь выбирает битрейт (когда в VBR кодер сам решает величину битрейта), PE же лишь корректирует его с помощью резервуара в зависимости от сложности музыки. Происходит это примерно следующим образом.
CBR. Для каждого фрейма выделяется "основное", постоянное количество бит, 90% от указанного битрейта и "дополнительное", переменное. Простые пассажи кодируются с помощью этих 90-а процентов, а оставшиеся 10% процентов накапливаются в резервуаре битов (как было описано вначале), вплоть до его заполнения, после чего на кодирование простых пассажей уходит весь битрейт (так как экономить биты некуда). Сложные пассажи кодируются используя полный битрейт плюс из резервуара изымаются дополнительные биты, если только в нём ещё есть биты. Плюсы: совместимость, минусы: из-за малого размера резервуара очень часто нахватает дополнительных бит для кодирования сложных мест.
ABR. При кодировании ABR использование резервуара минимизировано, он просто-напросто не нужен, ведь в ABR мы можем использовать фреймы с разным битрейтом и, соответственно, не накапливать биты в резервуаре (механизм работы ABR пояснен на примере выше). После вычисления PE и необходимого "дополнительного количества" бит, Lame просто выбирает минимальный битрейт в который укладывается полное необходимое количество бит (битрейт выбирается из таблицы). Остаток бит не выбрасывается, а накапливается в резервуаре.
Замечание: неправильно было бы думать, что в CBR и ABR совсем не используется психоакустика - конечно же это не так. Такая вещь как перераспределение битов отведённых на кодирование фрейма между всеми частотными полосами лежит именно на психоакустике.