- •Лабораторная работа субъективная оценка качества речевых сигналов при их обработке и кодировании Москва 2003
- •Цель и содержание работы
- •2. Задание
- •3. Описание фонограмм
- •4. Порядок и методика выполнения работы
- •6. Содержание отчета
- •Контрольные вопросы
- •8. Литература
- •Приложение 5 Низкоскоростное кодирование речевого сигнала и его разборчивость
МИНИСТЕРСТВО РОССИЙСКОЙ ФЕДЕРАЦИИ ПО СВЯЗИ И ИНФОРМАТИЗАЦИИ
М осковский технический университет связи и информатики
Кафедра радиовещания и электроакустики
Лабораторная работа субъективная оценка качества речевых сигналов при их обработке и кодировании Москва 2003
УДК 621.317.743
Лабораторная работа
СУБЪЕКТИВНАЯ ОЦЕНКА КАЧЕСТВА РЕЧЕВЫХ СИГНАЛОВ ПРИ ИХ ОБРАБОТКЕ И КОДИРОВАНИИ
Работу поставили: проф. С.Г. Рихтер и О.Б. Попов, ассистент С.А. Литвин и аспирант Е.А. Хрянин
Издание утверждено на заседании кафедры РВиЭА ___.___.2003. Протокол №____
Цель и содержание работы
В результате выполнения работы студент должен:
ознакомиться с методами обработки, кодирования и оценки качества речевых сигналов (РС);
практически освоить ускоренный метод измерения разборчивости речи — метод выбора;
изучить влияние обработки и низкоскоростного кодирования РС на их разборчивость в условиях помех.
При выполнении работы предусматривается прослушание CD-фонограмм с записями речевых сигналов. Каждый студент должен участвовать в четырех циклах таких прослушиваний, отмечая свой выбор в бланках специальных таблиц.
2. Задание
2.1. Изучите приложения к лабораторной работе и указанные разделы рекомендованной литературы.
2.2. Ознакомьтесь с описанием фонограмм (раздел 3).
2.3. Руководствуясь разделом 4, ознакомьтесь с порядком и методикой выполнения работы; подготовьте бланки таблиц для оценки разборчивости сигналов методом выбора.
3. Описание фонограмм
В работе используются четыре набора CD-фонограмм с записями речевого сигнала без обработки, с предварительной обработкой и с низкоскоростным кодированием. В каждом наборе содержится по четыре фонограммы, которые отличаются величиной отношения сигнал/шум (ОСШ), принимающего значения 0; 3; 6 и 12 дБ.
Запись первого набора фонограмм (1a,b,c,d) выполнена в соответствии с блок-схемой на рис.1 - без специальной обработки РС. Здесь обозначено: М – микрофон, РУ – усилитель звуковых частот с регулируемым коэффициентом усиления, ГШ – генератор шума, CDROM – “пишущий” CDROM.
.
Рис. 1
Во втором наборе фонограмм (2a,b,c,d) РС подвергался обработке авторегулятором уровня вещательного сигнала (АРГО) с последующим суммированием сигнала с шумом для обеспечения требуемых значений ОСШ (рис. 2).
.
Рис. 2
В третьем наборе фонограмм (3a,b,c,d), взамен АРГО на рис. 2, сигнал обрабатывался алгоритмом кодека CELP-4,8 кбит/с с последующим обеспечением требуемых значений ОСШ.
Четвертый набор фонограмм (4a,b,c,d) записывался в соответствии с блок-схемой на рис. 3. В этом случае “зашумление” речевого сигнала предваряет низкоскоростное кодирование, то есть кодированию подвергалась нормированная по уровню аддитивная смесь РС с шумом.
.
Рис. 3
Примечания.
В качестве модели шума использовался «белый шум» (равномерный спектр).
Все сигналы были предварительно ограничены по спектру 0,3…3,4 кГц, что соответствует полосе стандартного телефонного (информационного) канала.