- •2.4.3 Ацп с плавающей точкой……………………………………………
- •1 Цифровые фильтры
- •1.1 Явление Гиббса
- •1.1.1 Сущность явления Гиббса
- •1.1.2 Параметры эффекта
- •1.1.3 Последствия для практики
- •1.2 Весовые функции
- •1.2.1 Нейтрализация явления Гиббса в частотной области
- •1.2.2 Основные весовые функции
- •1.3 Типы фильтров
- •1.4 Разностное уравнение
- •Нерекурсивные фильтры
- •1.5.1 Методика расчетов нцф
- •1.5.2 Идеальные частотные фильтры
- •1.5.3 Конечные приближения идеальных фильтров
- •1.5.3.1 Применение весовых функций
- •1.5.3.2 Весовая функция Кайзера
- •1.5.4 Дифференцирующие цифровые фильтры
- •1.5.5 Гладкие частотные фильтры
- •1.6 Рекурсивные фильтры
- •6.3 Интегрирующий рекурсивный фильтр.
- •1.6.1 Принципы рекурсивной фильтрации
- •1.6.2 Режекторные и селекторные фильтры
- •1.6.2.1 Комплексная z-плоскость.
- •1.6.2.2 Режекторные фильтры
- •1.6.2.3 Селекторный фильтр
- •1.6.3 Билинейное z-преобразование
- •1.6.4 Типы рекурсивных частотных фильтров
- •1.7 Импульсная характеристика фильтров
- •Передаточные функции фильтров
- •1.9 Частотные характеристики фильтров
- •1.10 Частотный анализ цифровых фильтров
- •1.10.1 Сглаживающие фильтры и фильтры аппроксимации
- •1.10.1.1 Фильтры мнк 1-го порядка (мнк-1)
- •1.10.1.2 Фильтры мнк 2-го порядка (мнк-2)
- •1.10.1.3 Фильтры мнк 4-го порядка
- •1.10.2 Разностные операторы
- •1.10.2.1 Разностный оператор
- •1.10.2.2 Восстановление данных
- •1.10.2.3 Аппроксимация производных
- •1.10.3 Интегрирование данных
- •1.10.4 Расчёт фильтров по частотной характеристике
- •1.11 Фильтрация случайных сигналов
- •1.12 Структурные схемы цифровых фильтров
- •Обращенные формы.
- •1.13 Фильтры Чебышева
- •1.14 Фильтры Баттерворта
- •Свойства фильтров Баттерворта нижних частот:
- •1.15 Фильтры Бесселя
- •2 Аналого-цифровое преобразование
- •2.1 Цифровая обработка звуковых сигналов
- •2.2 Основы аналого-цифрового преобразования
- •2.2.1 Основные понятия и определения
- •2.3 Структура и алгоритм работы цап
- •Контрольные вопросы
- •2.4 Структура и алгоритм работы ацп
- •2.4.1 Параллельные ацп
- •2.4.2 Ацп с поразрядным уравновешиванием
- •2.4.3 Ацп с плавающей точкой
- •Контрольные вопросы
- •Глава 3. Звук.
- •3.1 Аудиосигнал
- •3.1.1 Звуковые волны
- •3.1.2 Звук как электрический сигнал
- •3.1.3 Фаза
- •3.1.4 Сложение синусоидальных волн
- •3.2 Звуковая система
- •3.2.1 Назначение звуковой системы
- •3.2.2 Модель звуковой системы
- •3.2.3 Входные датчики
- •3.2.4 Выходные датчики
- •3.2.5 Простейшая звуковая система
- •3.3 Амплитудно-частотная характеристика
- •3.3.1 Способы записи ачх в спецификации звуковых устройств
- •3.3.2 Октавные соотношения и измерения
- •3.3.3 Ачх реальных устройств воспроизведения звука
- •3.3.4 Диапазон частот голоса и инструментов
- •3.3.5 Влияние акустических факторов
- •3.4 Единицы измерения, параметры звуковых сигналов
- •3.4.1 Децибел
- •3.4.2 Относительная мощность электрических сигналов дБm
- •3.4.3 Децибелы и уровень звука
- •3.4.5 Громкость, уровень сигнала и коэффициент усиления
- •3.4.6 Громкость
- •3.5 Динамический диапазон
- •3.5.1 Запас динамического диапазона
- •3.5.2 Выбор динамического диапазона для реальной звуковой системы
- •3.6 Цифровой звук
- •3.6.1 Частота дискретизации
- •3.6.2 Разрядность
- •3.6.3 Дизеринг
- •3.6.4 Нойс шейпинг
- •3.6.5 Джиттер
- •3.7 Методы и стандарты передачи речи по трактам связи, применяемые в современном оборудовании (7 кГц)
- •3.7.1 Импульсно-кодовая модуляция (pcm — Pulse-Code Modulation)
- •3.7.3 Помехоустойчивость методов икм
- •3.7.4 Методы эффективного кодирования речи
- •3.7.5 Кодирование речи в стандарте cdma
- •3.7.6 Речевые кодеки для ip-телефонии
- •3.7.7 Оценка качества кодирования речи
- •3.8 Общие сведения по мр3
- •3.8.1 Феномен мрз
- •3.8.2 Что такое формат мрз?
- •3.8.3 Качество записи мрз
- •3.8.4 Формат мрз и музыкальные компакт-диски
- •3.8.5 Работа со звукозаписями формата мрз
- •3.9 Основные понятия цифровой звукозаписи
- •3.9.1 Натуральное цифровое представление данных
- •3.9.2 Кодирование рсм
- •3.9.3 Стандартный формат оцифровки звука
- •3.9.4 Параметры дискретизации
- •3.9.5 Качество компакт-диска
- •3.9.6 Объем звукозаписей
- •3.9.7 Формат wav
- •3.10 Формат mp3
- •3.10.1 Сжатие звуковых данных
- •3.10.2 Сжатие с потерей информации
- •3.10.3 Ориентация на человека
- •3.10.4 Кратко об истории и характеристиках стандартов mpeg.
- •3.10.5 Что такое cbr и vbr?
- •3.10.6 Каковы отличия режимов cbr, vbr и abr?
- •3.10.7 Методы оценки сложности сигнала
- •3.10.8 Какие методы кодирования стерео информации используются в алгоритмах mpeg (и других)?
- •3.10.9 Какие параметры предпочтительны при кодировании mp3?
- •3.10.10 Какие альтернативные mpeg-1 Layer III (mp3) алгоритмы компрессии существуют?
- •3.11 OggVorbis
- •3.13 Flac
- •4 Сжатие видео
- •4.1 Общие положения алгоритмов сжатия изображений
- •4.1.1 Классы изображений
- •4.1.2 Классы приложений
- •4.1.3 Требования приложений к алгоритмам компрессии
- •4.1.4 Критерии сравнения алгоритмов
- •4.2 Алгоритмы сжатия
- •Gif (CompuServe Graphics Interchange Format)
- •4.3 Вейвлет-преобразования
- •4.3.1 Вейвлеты, вейвлет-преобразования, виды и свойства Вейвлет анализ и прямое вейвлет-преобразование
- •Непрерывное прямое и обратное вейвлет-преобразования
- •Ортогональные вейвлеты
- •Дискретное вейвлет-преобразование непрерывных сигналов
- •Кратномасштабный анализ
- •Пакетные вейвлеты.
- •4.3.2 Примеры применения вейвлетов Очистка сигнала от шума
- •Очистка сигнала от шумов на основе вейвлет-преобразований.
- •4.4 Формат сжатия изображений jpeg
- •2) Дискретизация
- •3) Сдвиг Уровня
- •4) 8X8 Дискретное Косинусоидальное Преобразование (dct)
- •5) Зигзагообразная перестановка 64 dct коэффициентов
- •6) Квантование
- •7) RunLength кодирование нулей (rlc)
- •8) Конечный шаг - кодирование Хаффмана
- •4.5 Jpeg2000
- •4.5.1 Общая характеристика стандарта и основные принципы сжатия
- •4.5.2 Информационные потери в jpeg2000 на разных этапах обработки
- •4.5.3 Практическая реализация
- •4.5.4 Специализированные конверторы и просмотрщики
- •4.5.5 Основные задачи для развития и усовершенствования стандарта jpeg2000
- •4.6 Видеостандарт mpeg
- •4.6.1 Общее описание
- •4.6.2 Предварительная обработка
- •4.6.3 Преобразование макроблоков I-изображений
- •4.6.4 Преобразование макроблоков р-изображений
- •4.6.5 Преобразование макроблоков в-изображений
- •4.6.6 Разделы макроблоков
- •4.7 Mpeg-1
- •Параметры mpeg-1
- •4.8 Mpeg-2
- •4.8.1 Стандарт кодирования mpeg-2
- •4.8.2 Компрессия видеоданных
- •4.8.3 Кодируемые кадры
- •4.8.4 Компенсация движения
- •4.8.5 Дискретно-косинусное преобразование
- •4.8.6 Профессиональный профиль стандарта mpeg-2
- •4.9.11 Плюсы и минусы mpeg-4
- •4.10 Стандарт hdtv
3.7 Методы и стандарты передачи речи по трактам связи, применяемые в современном оборудовании (7 кГц)
Речь представляет собой колебания сложной формы, зависящей от произносимых слов, тембра голоса, интонации, пола и возраста говорящего.
Сжатие речи при ее передаче сокращает объем передаваемых данных, затраты и, благодаря этому, позволяет снижать цены на услуги и привлекать новых пользователей. Именно поэтому рынок цифровой телефонии развивается под непосредственным технологическим диктатом ученых и разработчиков кодеков речи.
Качество звучания сжатой речи в цифровой телефонии, мягко говоря, "не очень". Некоторые (из тех, конечно, кто имеет такой выбор) до сих пор предпочитают аналоговые сети цифровым, поскольку в последних речь часто звучит механически, случаются посторонние звуки и т. п. — и все из-за сжимающих кодеков речи, так как в остальном цифровые протоколы передачи обеспечивают лучшее качество звучания. В компьютерной телефонии снижению качества мы, помимо кодеков речи, обязаны заметным запаздываниям сигнала и ошибкам при сборке пакетов. Впрочем, это болезни роста: понятно, что если с кодеком на 2,4 кбит/с "узкий" канал справляется с трудом, то на скорости 1,2 кбит/с проблем будет меньше.
Спектр речи весьма широк (примерно от 50 до 10000 Гц), но для передачи речи в аналоговой телефонии когда-то отказались от составляющих, лежащих вне полосы 0,3-3,4 кГц, что ухудшило восприятие ряда звуков (например, шипящих, существенная часть энергии которых сосредоточена в верхней части речевого спектра), но мало затронуло разборчивость. Ограничение частоты снизу (до 300 Гц) также ухудшает восприятие из-за потерь низкочастотных гармоник основного тона. А в цифровой телефонии к влиянию ограничения спектра добавляются еще шумы дискретизации, квантования и обработки, дополнительно зашумляющие речь.
Решающими в выборе полосы 0,3-3,4 кГц были экономические соображения и нехватка телефонных каналов. Для совместимости по полосе с распространенными аналоговыми сетями в цифровой телефонии отсчеты аналоговой речи приходится брать согласно теореме Котельникова с частотой 8 кГц — не меньше двух отсчетов на 1 Гц полосы. Правда, в цифровой телефонии существует принципиальная возможность использовать спектр речи за пределами полосы 0,3-3,4 кГц и тем самым повысить качество, но эти методы не реализуются, так как они вычислительно пока еще очень сложны. При полосе исходного сигнала до 6 кГц и тактовой частоте отсчетов около 16 кГц сжатый цифровой сигнал требует для передачи канал в 12 кбит/с. При этом оценка качества по критерию MOS может быть выше 4,5 балла.
Озвученная речь, представляющая большую трудность для сжатия, образуется с помощью звуковых связок человека. Скорость их периодических колебаний задает так называемую частоту основного тона (ОТ) — периодическую подпитку энергией голосового тракта человека, который представляет собой объемный резонатор. Голосовой тракт формирует спектральную окраску речи, или, другими словами, ее формантную структуру. Другое название голосового тракта - синтезирующий фильтр — нам более удобно, так как математическое описание речеобразования обычно ведется в терминах линейной фильтрации. Тогда, условно, речевой сигнал можно разделить на две составляющие, отвечающие за 1- ый ОТ (возбуждение фильтра) и 2-ой голосовой тракт (формантная структура сигнала). Соответственно, большинство на сегодня используемых алгоритмов, так или иначе, решают один вопрос - как наиболее эффективно выделить и сокращенно описать обе составляющие. А отрезки глухой речи при моделировании заменяют спектрально окрашенным шумом.
Рассмотрим методы цифрового представления речи, к которым относятся: 1. прямое аналого- цифровое преобразование (или импульсно-кодовая модуляция, ИКМ); 2. эффективное кодирование речи, ЭКР (здесь можно выделить кодеры формы, вокодеры и кодеры, реализующие алгоритмы анализа через синтез).