31-01-2015_09-20-05 / Методические указания к выполнению лабораторной работы 2 по ЦСП
.pdfМетодические указания к выполнению лабораторной работы №2 по дисциплине «Цифровые системы передачи»
Исследование процесса квантования речевого сигнала
Красноярск
Золотухин, В.В.
Методические указания к выполнению лабораторной работы №2 «Исследование процесса квантования речевого сигнала» по дисциплине «Цифровые системы передачи» / В.В. Золотухин. – Красноярск, 2011. – 17 с.
В данных методических указаниях к лабораторной работе по предмету «Цифровые системы передачи» перед студентами ставится задача изучения процесса квантования речевого сигнала в цифровых системах передачи информации и возникающих при этом искажений (шума) квантования.
Предназначено для студентов, обучающихся по специальности 210406.65 «Сети связи и системы коммутации», а также направлению 210400.62 «Телекоммуникации».
© В.В. Золотухин
Цель лабораторной работы: изучение основных принципов процесса квантования речевого сигнала, понятия шумов квантования и ограничения, влияния величины шага квантования и максимальной допустимой амплитуды сигнала на шумы квантования и ограничения.
Теоретические сведения:
Квантование сигнала по уровню представляет собой процесс перехода от бесконечного множества допустимых значений сигнала к конечному, что делает возможным передачу номера уровня цифровым двоичным кодом с конечным числом бит (рисунок 1).
Рисунок 1 – Квантование сигнала по уровню
При этом квантованный сигнал обладает рядом преимуществ, в частности, при воздействии шумов есть возможность восстановить сигнал методом регенерации.
При квантовании вся область допустимых значений сигнала делится на N разрешенных уровня квантования, а сигнал при передаче каждый раз округляется до ближайшего разрешенного уровня квантования. Очевидно, что при этом неизбежно возникает ошибка округления (квантования):
кв(t) s(t) sкв(t).
Разность между соседними уровнями квантования называется шагом квантования.
Поскольку на приеме будут наблюдаться не истинные значения s(t), а квантованные sкв(t), то на выходе ФНЧ приема вместе с исходным сигналом появится еще и шум квантования εкв(t).
Рисунок 2 – Возникновение шума квантования
Для оценки помехозащищенности сигнала от шума квантования используется следующая формула:
A |
10lg |
|
Pc |
|
, |
|
|
|
|||
з кв |
|
|
|
||
|
|
|
Pкв |
|
где Pc – средняя мощность сигнала;
Pкв – средняя мощность шума квантования.
Помимо шумов квантования при кодировании первичных сигналов электросвязи проявляются еще и шумы ограничения, вызванные ограниченной разрядностью кодирующих устройств. Таким образом, на приеме помимо исходного сигнала будет наблюдаться смесь из двух видов шумов – шума квантования и шума ограничения.
Средняя мощность шума квантования определяется следующим образом. Предположим, что плотность распределения мгновенных значений квантуемого сигнала w(s) известна (рисунок 3). При достаточно большом числе уровней квантования N можно считать, что в пределах i-го участка квантования плотность распределения w(s)i равномерна и имеет вид
прямоугольника с шириной, равной величине шага квантования |
и высотой |
||
w(si). |
|
|
|
|
sкв(s), w(s) |
w(s) |
|
|
|
|
|
|
|
Uогр |
|
-Uогр |
|
Uогр |
|
|
|
|
s |
|
|
-Uогр |
|
|
εогр(s) |
|
|
-Uогр |
|
0 |
|
|
|
|
|
|
|
Uогр |
s |
Рисунок 3 – Средняя мощность шумов квантования и ограничения
Дисперсия шума квантования для i-го участка определяется следующим образом:
|
s |
2 |
|
i |
|
кв2 i |
|
s si 2 w(s)i ds. |
|
s |
2 |
|
i |
Но поскольку в пределах отдельного i-го участка плотность распределения w(s) практически постоянна, то есть не зависит от s и равна w(si), то последний интеграл после замены переменных (s-si)=εквi принимает следующий вид:
2
2квi w(si)
2
2 |
d |
|
p |
2 |
|
|
i |
. |
|||
|
12 |
||||
квi |
|
квi |
i |
|
где pi – вероятность попадания сигнала в i-ую зону квантования. Суммарная дисперсия определяется как сумма дисперсий в каждой из
зон квантования:
кв2 |
кв2 i pi |
i2 |
. |
||
12 |
|||||
|
i |
i |
|
||
При равномерном квантовании, |
когда все шаги i одинаковы, а сумма |
всех вероятностей pi равна 1, получаем следующее значение мощности шума квантования:
2
2 .
кв 12
Таким образом, при равномерном квантовании мощность шума квантования σкв зависит только от величины шага квантования кв и никак не зависит от уровня сигнала. Можно сказать, что в конечном счете мощность шумов квантования определяется числом уровней квантования.
Средняя мощность шумов ограничения проявляет себя только при значениях сигнала, большего Uогр, поэтому может быть рассчитана по формуле:
2
Pш огр 2 a Uогр w(a)da.
Uогр
Рисунок 4 – Зависимость ошибки ограничения от значения входного сигнала
Для субъективной оценки качества речевого сигнала, особенно в том случае, если он подвергается кодированию или сжатию, широко используется методика субъективной оценки, описанная в рекомендации МСЭ-Т P.800, также известная как методика MOS (Mean Opinion Score).
Согласно данной методике качество речи при прохождении сигнала от источника (говорящего) через всю систему связи к приемнику (слушающему) определяется как среднее арифметическое субъективных оценок, выставляемых экспертами после прослушивания сигнала на приемной стороне.
Оценки экспертами выставляются в соответствии с привычной в нашей стране пятибалльной шкалой:
5 – отлично (ухудшение сигнала не заметно для слушателя);
4 – хорошо (ухудшение сигнала заметно, но не раздражает);
3 – приемлемо (ухудшение качества слегка раздражает);
2 – плохо (ухудшение качества определенно вызывает раздражение);
1 – неприемлемо (ухудшение качества вызывает сильное раздражение).
При этом оценки 3,5 балла и выше соответствуют стандартному и высокому качеству телефонного сигнала, 3,0 – 3,5 – приемлемому качеству, 2,5 – 3,0 – синтезированному звуку. При передачи речи по цифровым системам передачи с хорошим качеством желательно ориентироваться на уровень оценки не ниже 3,5.
Ниже приведены оценки MOS для различных кодеков:
G.711 (ИКМ, нелинейный кодек с поразрядным взвешиванием, 64
кбит/c) – 4,3;
G.729 (скорость передачи данных – 8 кбит/с) – 3,92;
G.723.1 (MPC-MLQ - Multipulse LPC with Maximum Likelihood Quantization, 6,2 кбит/c) – 3,9;
G.726 (АДИКМ-кодек, 32 кбит/c) – 3,8;
G.723.1 (ACELP-кодек, 5,3 кбит/c) – 3,62;
G.728 (LD-CELP-кодек, 16 кбит/c) – 3,61.
Исходные данные:
Для каждой подгруппы, состоящей из двух студентов, преподавателем выдается индивидуальное задание в соответствии с номером варианта. Выполнение, составление отчета о проделанной работе и защиту следует проводить всей подгруппой. Исходные данные для разных вариантов приведены в таблице 1.
Таблица 1 – Исходные данные для выполнения лабораторной работы в соответствии с номером варианта (задание 3)
Вариант |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Файл |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
10 |
20 |
5 |
50 |
100 |
10 |
20 |
100 |
100 |
10 |
2 |
100 |
200 |
50 |
100 |
200 |
300 |
50 |
1000 |
500 |
100 |
3 |
1000 |
2000 |
500 |
1000 |
500 |
1000 |
400 |
5000 |
1000 |
1000 |
4 |
5000 |
10000 |
300 |
5000 |
1000 |
5000 |
1000 |
10000 |
2000 |
10000 |
5 |
10000 |
20000 |
5000 |
10000 |
3000 |
15000 |
5000 |
20000 |
4000 |
30000 |
Таблица 2 – Исходные данные для выполнения лабораторной работы в соответствии с номером варианта (задание 5)
Вариант |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Uогр1 |
100 |
50 |
10 |
20 |
70 |
200 |
30 |
60 |
80 |
90 |
Uогр2 |
500 |
250 |
50 |
100 |
350 |
1000 |
150 |
300 |
400 |
450 |
Uогр3 |
1000 |
500 |
100 |
200 |
700 |
2000 |
300 |
600 |
800 |
900 |
Uогр4 |
5000 |
2500 |
500 |
1000 |
3500 |
10000 |
1500 |
3000 |
4000 |
4500 |
Uогр5 |
10000 |
5000 |
1000 |
2000 |
7000 |
20000 |
3000 |
6000 |
8000 |
9000 |
Порядок выполнения лабораторной работы:
1.Запустить программную среду Mathsoft MathCAD.
2.Открыть звуковой файл формата WAV:
Таким образом, для считывания звукового файла формата WAV в массив используется функция READWAV. Для получения атрибутов файла используется другая функция – GETWAVINFO. Она позволяет получить такие характеристики звукового файла, как число каналов, частота дискретизации, количество бит на один отсчет и скорость цифрового потока.
Считанный с помощью функции READWAV файл помещается в одномерный или двухмерный массив (в случае стерео), каждый элемент которого представляет собой отсчет речевого сигнала.
В общем случае речевой сигнал представляет собой последовательность отсчетов дискретизированного аналогового сигнала, взятых с частотой дискретизации fд. Такой способ
представления речевой информации называют импульсно-кодовой модуляцией (ИКМ) или PCM (pulse code modulation). В таком формате речевая информация хранится в файлах формата WAV и на аудио компакт-дисках (Audio-CD).
Формат данных WAV был разработан компаниями Microsoft и IBM для хранения аудиоданных. Файлы с расширением WAV в общем случае представляют собой контейнер для хранения любых речевых данных, в том числе сжатых. Однако в большинстве случаев в подобных файлах речевой сигнал хранится в несжатом виде – LPCM (Linear Pulse Code Modulation) или линейной ИКМ, то есть импульсно-
кодовая модуляция с линейным квантованием. Частота дискретизации может варьироваться в пределах от 1 Гц до 4,3 ГГц, а число каналов – до 65536. На практике же наиболее часто используют лишь определенные характеристики, например, два канала, частота дискретизации - 44100 отсчетов/с, 16 бит на один отсчет.
Отсчеты речевого сигнала принимают значения от 0 до 255 для 8- битных значений и от -32768 до 32767 для 16-битных значений. Причем отсутствию сигнала (тишине) соответствует уровень квантования 128 в первом случае и 0 во втором.
Поскольку абсолютное значение шага квантования в данном случае неизвестно, все приводимые далее рекомендации справедливы для относительного значения шага квантования.
3.Осуществить изменение величины шага квантования в соответствии с индивидуальными исходными данными:
Для выполнения данного задания предлагается использовать функцию Round(z,y), которая осуществляет округление z до ближайшего значения, кратного y.
4.Оценить мощность шумов квантования при различных значениях шага квантования: