Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СПРСИРО.pdf
Скачиваний:
272
Добавлен:
16.03.2016
Размер:
2.99 Mб
Скачать

5.КОДИРОВАНИЕ РЕЧЕВЫХ СООБЩЕНИЙ

5.1.РЕЧЕВЫЕ КОДЕКИ

Передача речи является основным, обязательным режимом работы систем мобильной связи. Звук с помощью акусто-электронного преобразователя (микрофона) превращается в аналоговый электрический сигнал. Поскольку в цифровых системах связи канальному кодированию подвергается последовательность бит, аналоговый речевой сигнал должен быть представлен в цифровой форме. При этом для эффективного использования канала требуется устранить его избыточность до величины, позволяющей на приемной стороне восстановить по нему звук с сохранением индивидуальных особенностей голоса (натуральность).

За длительный период развития телефонной связи были достаточно подробно изучены характеристики речи и устройство речевого аппарата человека. Так, установлено, что для обеспечения приемлемого качества восстановленной речи достаточно анализировать (передавать) речевой сигнал в полосе частот 300...3400 Гц. Выяснены и причины большой избыточности речевого сигнала. К ним относятся:

неравномерное распределение значений (отсчетов) сигнала (редки большие отсчеты);

высокая корреляция соседних отсчетов;

корреляция удаленных отсчетов, обусловленная периодичностью

сигнала;

корреляция между периодами основного тона (см. далее);

избыточность из-за пауз между слогами, словами, фразами при монологе, которые составляют (в среднем) до 25% времени разговора, и пауз, когда надо слушать собеседника (до 50% времени).

Задача устранения этой избыточности возлагается на речевые кодеки - устройства, осуществляющие кодирование речевого сигнала и его декодирование (восстановление). Основная проблема при разработке кодеков состоит в получении высокой степени сжатия без чрезмерного снижения качества восстановленной речи. Таким образом, основными характеристиками кодеков являются скорость преобразования

Rt = k t ,

(5.1)

где k - число бит на выходе кодера на интервале времени t, и качество восстановленной речи.

Скорость преобразования Rt является важной характеристикой речевых кодеков, так как определяет требуемую пропускную способность канала для передачи речи. Сжатие сигнала тем больше и, следовательно, кодек тем эффективнее, чем меньше Rt (при обеспечении требуемого качества восстановленной речи).

73

Для оценки качества восстановленной речи предложены объективные и субъективные методы и критерии. Поскольку получателем речевого сообщения является человек, важно оценить его субъективное восприятие речи. Стандартами определена средняя экспертная оценка (MOS - mean opinion score), шкала которой имеет 5 градаций: 5 - качество превосходное, 4 - хорошее, 3 - посредственное, 2 - плохое, 1 - неудовлетворительное. Кодеки современных цифровых систем мобильной связи имеют MOS около 4.

Рассмотрим принципы построения речевых кодеков. Методы сжатия речевых сообщений можно разделить на 2 группы: кодеры формы речевого сигнала и вокодеры. Совместное использование этих методов характерно для так называемых гибридных кодеров.

5.2. КОДЕРЫ ФОРМЫ РЕЧЕВОГО СИГНАЛА

Кодеры формы позволяют сохранить основную форму непрерывного сигнала. Они не являются специфичными для речи и могут применяться для сжатия любого непрерывного сигнала. Непрерывный сигнал источника кодируется в два этапа. Сначала с помощью аналого-цифрового преобразования (АЦП) формируются последовательности, дискретные по уровню и времени, т.е. производится так называемое натуральное кодирование. Затем используются собственно методы сжатия дискретных последовательностей.

Преобразование непрерывного сигнала в цифровую форму в литературе часто именуется импульсно-кодовой модуляцией (ИКМ), хотя в реальности ни

окакой модуляции несущей речь не идет.

Всоответствии с теоремой Котельникова аналоговый сигнал x(t) заменяется своими непрерывными отсчетами xН = (n t) , взятыми через

интервал времени

t =1 FД

где FД - частота

дискретизации,

в два

раза

превышающая верхнюю частоту FB спектра x(t). Поскольку

t

известен и на

приемной стороне, в обозначениях его можно опустить.

 

 

 

 

Далее диапазон изменения хн(п) разбивается на 2k дискретных уровней

через интервалы

x , называемые шагом квантования.

Отсчет

хн(n),

удовлетворяющий условию s(n) x хн(п)<[s(n)

+ 1] x ,

где s(n) - целое,

принадлежащее отрезку [ 2k 1 ,+2k 1 ], заменяется значением s(n)

x. При этом

возникает погрешность, максимальное значение которой

 

равно

х.

Последовательность таких погрешностей называется шумом квантования.

Результатом

ИКМ

аналогового

сигнала

x(f)

является

последовательность чисел s(1), s(2),..., s(n-1), s(n), s(n + 1),... . Каждое s(i)

представляется в двоичной системе счисления, для чего требуется k бит. Первый бит определяет знак отсчета, остальные - его значение (младшие разряды справа).

По каналу за время t передаются k бит. На приемной стороне аналоговый сигнал восстанавливается с помощью цифро-аналогового преобразователя (ЦАП) и интерполятора (фильтра нижних частот), например, по формуле

74

x = s(i)

x

sin 2πF(t i t)

.

(5.2)

 

i

 

2πF(t i t)

 

Из-за шумов квантования и погрешностей интерполяции x(t) x(t) . Для речевых сигналов числа s(i) являются зависимыми случайными величинами. Для сжатия таких последовательностей широко используется кодирование с предсказанием.

Если известен (даже не очень точно) вид зависимости отсчетов друг от друга, то оценку текущего отсчета s(n) можно вычислить (предсказать) по т предыдущим отсчетам s(n m), s(n m +1),..., s(n 1) . При этом в канал разумно

посыпать только ошибку предсказания e(n) = s(n) s(n) . На приемной стороне с помощью такого же предсказателя вычисляется прогноз s(n) и восстанавливается сначала текущий цифровой отсчет s(n) = s(n) + e(n) , а затем (с помощью ЦАП) и аналоговый x(t) .Сжатие данных здесь достигается за счет того, что диапазон изменения e(п) существенно меньше, чем диапазон изменения s(n). Поэтому при той же точности представления требуется меньшее, чем при ИКМ, число двоичных разрядов. Основной проблемой является разработка достаточно просто реализуемых предсказателей, обеспечивающих минимальную среднеквадратическую ошибку е(п).

На практике используется линейное предсказание, при котором

m

 

s(n) = ai s(n i) ,

(5.3)

i=1

где ai - коэффициенты предсказания; т - порядок предсказания, обычно

равный 8-10.

Такое экономное кодирование называется дифференциальной ИКМ (ДИКМ). Так как зависимости между отсчетами s(i) на отдельных временных интервалах могут меняться, для уменьшения е(n) необходимо подстраивать коэффициенты предсказания аi. Эти изменения должны передаваться на приемную сторону. В этом случае дифференциальную ИКМ называют

адаптивной (АДИКМ).

Другой, полярный по отношению к ИКМ, метод кодирования называется дельта-модуляцией (ДМ). Частота дискретизации Рд выбирается в десятки раз больше верхней частоты FB спектра x(f). Ошибка предсказания е(п) представляется 1 битом, указывающим только знак ошибки - s(n) x больше или меньше хн(п). Предсказанное значение получается из предыдущего добавлением или вычитанием фиксированного значения Д (отсюда и название метода кодирования). В зависимости от скорости изменения x(t) величину можно оперативно изменять, что соответствует адаптивной ДМ (АДМ). Говорят, что если при ИКМ сигнал x(t) квантуется грубо по времени и точно по уровню, то при ДМ - точно по времени и грубо по уровню.

75

Экспериментально установлено, что качество речи, восстановленной после ИКМ, остается высоким, если частота дискретизации Fд=8 кГц, а каждый отсчет s(n) представлен k=8 битами. ИКМ с такими параметрами лежит в основе так называемой первичной ИКМ и формирует согласно (9.1) поток бит со скоростью Rt = 64 кбит/с. Однако корреляция соседних отсчетов при этом превышает 0,85, что говорит о высокой избыточности полученной последовательности. Использование ДИКМ, АДИКМ позволяет снизить скорость преобразования примерно в 2 раза с сохранением высокого качества восстановленной речи.

5.3.ВОКОДЕРЫ

Ввокодерах (от английского voice coder) измеряются параметры речевого аппарата человека, по которым на приемной стороне создается аналог такого же аппарата и синтезируется звук. При этом постулируется, что

втечение 20...30 мс эти параметры остаются постоянными. Поэтому перед сжатием поток бит ИКМ нарезается на сегменты, содержащие по 160-240 отсчетов для оценки постоянных параметров.

Разработка вокодеров основана на использовании различных моделей голосового тракта. На рис. 5.1 показана однотрубная модель речеобразующего аппарата человека.

Модель представляет собой М последовательно соединенных секций одинаковой длины, имеющих постоянную (в пределах секции) площадь сечения. Если вдувать воздух в такой свисток (подавать сигнал возбуждения), то в зависимости от конфигурации соединения и сигнала возбуждения на выходе формируется тот или иной звук. Таким образом, звук, получаемый с помощью данной модели, можно задать параметрами сигнала возбуждения и

Мзначениями площадей секций свистка.

Рис. 5.1. Модель голосового тракта

Важной характеристикой сигнала возбуждения является частота основного тона F0. Поток воздуха из легких человека прерывается голосовыми связками, и возникает последовательность импульсов с частотой следования от 80 до 1200 Гц. Значения периода основного тона T0 = 1/F0 коррелированы в

76

соседних сегментах речи. От точности описания основного тона зависит и степень сжатия, и качество синтезированной речи.

С помощью вокодеров получены большие коэффициенты сжатия, но синтезированная речь при этом характеризуется низким качеством из-за механической монотонности, отсутствия индивидуальной окраски.

Значительные успехи в сжатии речевых сигналов при приемлемом качестве достигнуты в результате совместного использования методов линейного предсказания и техники вокодеров. Выяснено, что площади секций модели на рис. 5.1 связаны нелинейными функциональными соотношениями с коэффициентами а линейного предсказания (5.2). Схема речевого кодека в общем виде показана на рис. 5.2, где анализирующий и синтезирующий фильтры строятся на основе (5.2).

Алгоритмы сжатия, описываемые данной схемой, могут отличаться способом формирования сигнала возбуждения. Известны следующие разновидности сигнала возбуждения: возбуждение от основного тона, от ошибки предсказания е(п), многоимпульсное возбуждение и возбуждение от кода.

Самым простым является возбуждение от основного тона. В каждом периоде основного тона формируется один импульс для вокализованного сегмента (содержащего сигнал звука) и шумоподобный сигнал для невокализованного сегмента. На приемную сторону, следовательно, должен передаваться признак вокализованности анализируемого сегмента.

Рис. 5.2. Схема метода линейного предсказания

Возбуждение от ошибки предсказания приводит к металлическому оттенку синтезированной речи.

Многоимпульсное возбуждение обеспечивает лучшее качество воспроизведения и не требует классификации сегментов на вокализованные и невокализованные. Сигнал возбуждения определяется положением и амплитудами 8-13 импульсов в анализируемом интервале.

Для формирования сигнала возбуждения, обеспечивающего минимальную среднеквадратическую ошибку е(п), используется метод анализа через синтез, схема которого показана на рис. 5.3.

В кодер введен синтезатор речевого сигнала (декодер) точно такой же, как и на приемной стороне. С его помощью подбираются и передаются параметры оптимального сигнала возбуждения. В приемнике по этим

77

параметрам восстанавливается речевой сигнал этим же синтезатором, что и обеспечивает минимальную ошибку, равную ошибке, допущенной при кодировании.

Рис. 5.3. Схема метода анализа через синтез

Так, в кодеке стандарта GSM в каждой четверти сегмента, содержащей по 40 отсчетов, формируются 3 регулярные последовательности из 13 импульсов разной амплитуды, отличающиеся сдвигом относительно начала подсегмента. В качестве сигнала возбуждения выбирается последовательность с наибольшей энергией. Параметры этой последовательности: амплитуды импульсов, номер выбранной последовательности кодируются и передаются на приемную сторону, где по ним синтезируется сигнал возбуждения для фильтра (5.2). Эти операции отображены в названии кодера - кодер с регулярным возбуждением, долговременным предсказанием и линейным предсказанием (RPE/LTP-LPC - regular pulse excitation/long term prediction - linear predictive code). Долговременное предсказание предназначено для устранения избыточности за счет корреляции периодов основного тона (фильтр с большой постоянной времени), а линейное предсказание - для учета корреляции соседних отсчетов (фильтр с малой постоянной времени). Скорость преобразования - 13 кбит/с, коэффициент сжатия относительно первичной ИКМ - примерно 5.

Структурная схема кодера речевого сигнала стандарта GSM реализующая алгоритмы краткосрочного и долговременного предсказаний и преобразований, показана на рис. 5.4. Она содержит четыре секции – предварительной обработки, краткосрочного предсказания (STP), долговременного предсказания (LTP), и импульсного возбуждения (RPE). Информационные биты, полученные в результате преобразований и передаваемые далее в тракт, следующие: коэффициенты LAR (36 битов на каждые 20 мс), RPE параметры (47 битов на каждые 5 мс), и параметры LTP – 9 битов на каждые 5 мс.

78

Рис. 5.4. Структурная схема кодера речевого сигнала стандарта GSM

Наиболее эффективным методом сжатия речевого сигнала до скоростей

4-16 кбит/с считается алгоритм CELP (code excited linear prediction) -

линейное предсказание и многоимпульсное возбуждение от кода (стандарты TETRA и IS-95). Сигнал возбуждения берется из заранее созданной кодовой книги, которая содержит от 210 до 216 векторов. Содержимое кодовой книги определяется в результате анализа достаточно длинных реальных речевых сигналов (детерминированная книга). В стохастическую (алгебраическую) книгу записываются коды отсчетов нормального белого шума с нулевым средним и единичной дисперсией.

Поиск оптимального вектора возбуждения требует проведения достаточно объемных вычислений. За 5-8 мс для каждого вектора надо определить ошибки предсказания, вычислить взвешенную среднеквадратическую ошибку и в качестве оптимального выбрать вектор, обеспечивающий минимальную ошибку. Номер (индекс) такого вектора передается по каналу. Для уменьшения числа операций вводятся дополнительные упрощенные книги. В приемнике имеется точная копия кодовой книги, из которой по принятому индексу извлекается оптимальный вектор возбуждения и посылается в синтезатор, идентичный используемому в кодере. На рис. 5.4 приведена структурная схема декодера CELP стандарта TETRA, а в табл. 5.1 показано поразрядное распределение передаваемой информации при обработке 4 блоков сегмента в 30 мс.

Синтезирующий фильтр Ф1 реализует долговременное предсказание, а фильтр Ф2 - линейное (5.2). Из табл. 5.1 видно, что параметры оптимального

79

сигнала возбуждения вычисляются в каждой четверти сегмента. Скорость преобразования 4,6 кбит/с, коэффициент сжатия - примерно 14.

Наличие пауз в процессе телефонного разговора позволяет организовать

прерывистую передачу речи (DTX - discontinuous transmission), при которой передатчик МС включается только в периоды существования звука (в так называемые периоды активности абонента). Как уже отмечалось, такие периоды составляют в среднем около 25% времени сеанса связи. В паузах выделенный для трафика физический канал может быть передан другим абонентам или использован для передачи неречевых данных. В системах CDMA выключение МС не только экономит емкость ее аккумуляторов, но и снижает уровень внутрисистемных помех в обратном канале, что эквивалентно увеличению абонентской емкости системы.

Рис. 5.4. Декодер по методу возбуждения от кода

Чтобы на приемной стороне во время выключения передатчика не возникали интервалы абсолютной тишины, и принимающий абонент не беспокоился об исправности телефонного тракта, генерируется так называемый комфортный шум. Создаваемый шум должен быть похож на натуральный фон передающей стороны (шум автомобиля, улицы). Для этого МС во время пауз периодически транслирует параметры естественного шума, которые учитываются при генерации комфортного шума.

Таблица 5.1. Распределение передаваемой информации

Параметр

Блок 1

Блок 2

Блок 3

Блок 4

Всего

бит

 

 

 

 

 

 

Коэффициенты аi

 

 

 

 

26

Период

основного

8

5

5

5

23

тона

 

 

 

 

 

 

 

Индекс

 

16

16

16

16

64

алгебраической книги

 

 

 

 

 

Коэффициенты

6

6

6

6

24

усиления

 

 

 

 

 

 

 

ВСЕГО

 

 

 

 

 

137

 

 

 

 

 

 

80

Для организации прерывистой передачи речи требуется определять интервалы времени, в которых звук отсутствует. Эту задачу решают детекторы активности речи. В системе GSM работа детектора активности основана на различии спектральных характеристик речи и шума (предполагается, что спектр шума равномернее, чем спектр речи), а также на периодичности звука и непериодичности шума. Сигнал с выхода линейного предсказателя кодера фильтруется и сравнивается с адаптивным порогом, величина которого устанавливается в интервалы действия только шума. При превышении порога принимается решение о наличии речи, в противном случае фиксируется ее отсутствие и передатчик МС выключается. Для уменьшения вероятности ложного выключения, что приведет к разрывам речи, решение об отсутствии звука выносится после накопления данных в течение 60... 100 мс.

81

6. МОДУЛЯЦИЯСИГНАЛОВВЦИФРОВЫХСИСТЕМАХМОБИЛЬНОЙ СВЯЗИ

6.1. КРИТЕРИИ ВЫБОРА МОДУЛЯЦИОННЫХ ФОРМАТОВ ПРИ ЦИФРОВОЙ ПЕРЕДАЧЕ ДАННЫХ

Для транспортировки информации на расстояние с помощью радиоволн отведенного диапазона необходима модуляция несущего гармонического колебания высокой частоты f0 низкочастотным сигналом, взаимно однозначно отображающим передаваемое сообщение. Если не касаться достаточно экзотических вариантов, осуществимых только на волновом уровне (поляризационная, пространственная модуляция), в арсенале разработчика системы связи присутствуют три традиционные разновидности модуляции: амплитудная, частотная, фазовая (последние две можно трактовать как одну - угловую) со всеми их комбинациями и частными версиями. Как и вообще в инженерном проектировании, при предпочтении того или иного способа модуляции приходится искать компромисс между конфликтующими требованиями. В первую очередь речь идет о разумном использовании радиочастотного ресурса: с одной стороны, избранный вид модуляции должен обеспечивать необходимую достоверность передачи, с другой - обладать достаточной спектральной эффективностью, т. е. распоряжаться выделенным участком диапазона с должной экономностью. Противоречивость этих требований очевидна: как следует из фундаментальных положений теории связи, при прочих равных условиях качество передачи возрастает с расширением спектра сигнала, тогда как стремление улучшить показатели и абонентской емкости, электромагнитной совместимости и удельной (приходящейся на единицу полосы) скорости передачи, наоборот, подталкивает к бережливости в расходовании предоставленного частотного ресурса.

Оставляя в стороне сходящие со сцены системы первого поколения (NMT, AMPS и др.), в которых речевые сообщения передаются с помощью обычной аналоговой ЧМ, обсудим подходы к выбору дискретных форматов модуляции (манипуляции), характерные для цифровых стандартов мобильной связи второго и третьего поколений. В качестве общей модели сигнала примем последовательность одинаковых по форме импульсов (посылок), повторяющихся с постоянным интервалом :

 

s(t)= S0 (t i )cos(2πf0 +ϕi )

(6.1)

i=−∞

где S0(t) - огибающая посылки; ϕi начальная фаза i-й посылки.

В простейшем случае бинарной фазовой манипуляции - БФМ (в англоязычной литературе BPSK - binary phase shift keying) - посылки полагаются прямоугольными и примыкающими друг к другу, т.е. имеющими длительность , а фазы ϕi , принимают лишь 2 возможных значения: 0 или π. Таким образом,

каждая посылка передает один двоичный символ и при фиксированной

длительности

и мощности сигнала БФМ реализует наиболее

 

82

помехоустойчивый способ двоичной телеграфии, так как импульсы с фазами 0 и π являются противоположными, т.е. максимально удаленными. В отношении же расходования частотного ресурса описанная версия БФМ оказывается чрезвычайно неэффективной. Дело в том, что спектр мощности сигнала (4.1) совпадает по форме с энергетическим спектром посылки S0(t), и когда последняя прямоугольна, убывает с частотой f весьма медленно - пропорционально 1/f2. Если, как это часто делается в технике связи при регламентации использования радиоспектра, измерять полосу сигнала шириной окна f99, в котором удерживается не менее 99% излучаемой мощности, для БФМ

получится цифра,

многократно превосходящая традиционный ориентир 1/

:

f99≈18,5/ . По

этой причине БФМ с прямоугольными посылками

не

применяется в цифровой мобильной телефонии.

 

Для повышения спектральной эффективности можно наметить несколько путей. Простейший из них состоит в увеличении длительности прямоугольной

посылки

с сохранением прежней

скорости передачи

Rt в

числе бит на

единицу времени. При БФМ один бит

передается за время

Ть=

, так что Rt =

1/ТЬ. Для удержания этой скорости при "удлинении" посылки следует увеличить число возможных значений фазы ϕi . Так, при удвоении длительности посылки

( = 2Tb) в течение временного отрезка придется передавать 2 бита информации, т.е. 4 различных сообщения, что может быть достигнуто за счет использования четырех разрешенных значений фазы вместо двух, например 0, π, π /2, -π /2. Такой способ манипуляции называют квадратурной ФМ – КФМ (QPSK - quadrature phase shift keying). Можно видеть, что КФМ в 2 раза экономнее БФМ в отношении использования частотного ресурса, поскольку имеет спектр той же формы, но суженный вдвое за счет двукратного растяжения посылки. Особо подчеркнем, что указанный выигрыш достигнут без ухудшения помехоустойчивости приема. В самом деле, пусть энергия посылки при БФМ равна Еb. Тогда евклидово расстояние между противоположными посылками (геометрически представляющими собой противоположные векторы длины Еb ), определяющее вероятность их

перепутывания, составит 2 Еb (рис. 6.1, а).

При КФМ четырем сообщениям отвечает четверка биортогональных векторов длины 2Еb (рис. 6.1, б), так как при неизменной мощности энергия

посылки Eq удвоится по сравнению со случаем БФМ за счет удвоения длительности: Eq= 2Eb. При этом расстояние между соседними векторами, определяющее наибольшую из вероятностей перепутывания сообщений, останется прежним ( 2Еq = 2 Еb ), что и означает отсутствие сколько-нибудь

заметного ухудшения помехоустойчивости приема при переходе от БФМ к КФМ.

Не составляет труда убедиться, что при дальнейшем увеличении длительности посылки требование поддержания постоянства скорости приведет к сближению соседних векторов.

Так, утроение длительности без снижения скорости означает передачу одной посылкой восьми сообщений, так что трехкратный рост энергии посылки

83

по сравнению с БФМ будет нивелироваться уменьшением угла между соседними сигналами до 45° (рис. 6.1, в), т.е. уменьшением минимального

евклидова расстояния до 3Eb (2 2 2) . Таким образом, в данном случае

трехкратный выигрыш в полосе приобретается ценой энергетических потерь порядка 3,5 дБ (именно таким должно быть увеличение энергии, компенсирующее сближение векторов и снижающее вероятность ошибки до прежнего уровня). Дальнейшее повышение спектральной эффективности подобным способом окажется тем более невыгодным в плане энергозатрат: M- кратный выигрыш в полосе при 2M-ричной ФМ будет сопровождаться

2

 

 

 

энергетическим проигрышем в у =

 

 

 

раз.

M (1cos

π

)

2M 1

 

 

 

 

 

В принципе существует возможность определенного снижения упомянутых энергетических потерь за счет оптимизации созвездия сигнальных векторов на плоскости, максимизирующей минимальное расстояние между сигнальными векторами. При этом последние имеют неодинаковую длину, т.е. фазовая манипуляция дополняется параллельной амплитудной. Подобные форматы, известные под названиями амплитудно-фазовая и квадратурная амплитудная манипуляции (АФМ и КАМ), широко распространены во многих телекоммуникационных сетях (кабельная, радиорелейная связь и т. д.). Однако специфика систем беспроводной мобильной телефонии состоит в исключительной важности эффективного энергосбережения, продлевающего срок автономной (без подзарядки или смены батарей) работы портативного терминала и способствующего коммерческой привлекательности его массогабаритных характеристик. По этим причинам многократная (с числом фаз 16 и более) ФМ наряду с АФМ и КАМ не рассматриваются как приемлемые альтернативы для организации радиоинтерфейсов сетей мобильной связи, хотя восьмиуровневая ФМ (8-PSK) избрана как инструмент увеличения скорости передачи в системах второго поколения в рамках спецификации EDGE.

6.2. МОДУЛЯЦИОННЫЕ ФОРМАТЫ ЦИФРОВЫХ СТАНДАРТОВ СОТОВОЙ СВЯЗИ ВТОРОГО И ТРЕТЬЕГО ПОКОЛЕНИЙ

Различные модификации КФМ находят самое широкое применение в сетях цифровой мобильной связи как второго, так и третьего поколений. Мотивами усовершенствований по сравнению с базовым вариантом КФМ служат, с одной стороны, все та же заинтересованность в компактном спектре, а с другой - стремление к оптимизации энергетического режима усилителя мощности передатчика подвижного терминала. Поясним подробнее смысл последнего фактора.

Энергопотребление передатчика в значительной мере зависит от режима оконечного усилителя мощности или, иначе говоря, от пик-фактора сигнала, равного отношению его пиковой и средней мощностей. Наиболее благоприятным считается режим класса С, когда активный элемент усилителя постоянно находится вблизи точки насыщения, выполняя, по существу,

84

функции ключа, и требования к его линейному динамическому диапазону минимальны. Для приближения к подобному режиму передаваемый сигнал должен быть свободен от глубокой амплитудной модуляции, т.е. иметь пикфактор, близкий к единице. Данное условие, в свою очередь, означает, что скачки мгновенной фазы, сопровождающие переход от данной посылки к последующей, должны быть по возможности минимизированы.

Обратимся за подтверждением к рис. 6.2. Когда значения передаваемых символов 0 и 1 при БФМ (рис. 6.1, а) равновероятны, в среднем в половине переходов между последовательными посылками наблюдается скачок фазы на 180°, т.е. смена полярности на противоположную. Изменение мгновенной комплексной огибающей от А до или наоборот должно быть без искажений передано усилителем мощности, которому тем самым навязывается чрезмерное требование в части линейного динамического диапазона (2А). Поскольку при линейной передаче перепадов большая часть мощности рассеивается на активном элементе усилителя, становится понятным желание снизить частоту и размах скачков фазы в манипулированном сигнале. Переход от БФМ к стандартной КФМ (рис. 6.1, б) с сохранением прежней мощности не ослабляет требований к динамическому диапазону усилителя, поскольку максимальные скачки фазы в 180° сохраняются, хотя и случаются значительно (примерно вдвое) реже.

Рис. 4.1. Перепады мгновенной амплитуды при различных видах модуляций

Смягчение требований к динамическому диапазону передатчика достигается в формате КФМ со сдвигом - КФМС (OQPSK - offset QPSK), для понимания смысла которого разумно сначала ввести в (4.1) начальную фазу в π/4 (разумеется, это никак не повлияет на свойства КФМ и лишь повернет целиком диаграмму рис. 4.2, б на 45°), а затем переписать результат в форме:

 

π ) =

1

 

(t i )sin(2πf0t)

s(t) = S0 (t i ) cos(2πf0t +

ϕi +

ai S0 (t i

) cos(2πf0t) + bi S0

i=−∞

 

4

 

2

i=−∞

i=−∞

 

 

где ai = cosϕi sinϕi

и bi

= −cosϕi sinϕi бинарные символы,

принимающие

значения+1 и-1.

Как видно, КФМ-сигнал можно интерпретировать как сумму двух квадратурных БФМ-сигналов, что дает возможность демодулировать каждую

85

из последовательностей символов { ai },{bi } отдельно от другой, поскольку

синусная и косинусная квадратурные компоненты ортогональны и не создают друг другу перекрестных помех при когерентном приеме. Сдвинем теперь синусную квадратурную составляющую во времени на половину длительности посылки, придя к результату

 

1

 

 

 

)sin(2πf0t)

 

 

s(t) =

ai S0 (t i

) cos(2πf0t) + bi S0 (t i

2

,

(6.2)

 

2

i=−∞

i=−∞

 

 

 

 

сохраняющему ортогональность квадратурных компонент и, следовательно, все характеристики обычной КФМ в части качества передачи данных. Теперь, однако, изменения бинарных символов, манипулирующих квадратурные несущие, происходят неодновременно: в момент смены символа ai , символ

другой квадратуры bi остается неизменным и наоборот (рис. 6.2).

Рис. 6.2. Изменение формы сигнала при цифровой модуляции

Благодаря этому при каждой смене символа ai или bi сигнальный вектор

на рис. 6.1, б может перейти только в соседний, но никак не в противоположный. Тем самым требуемый линейный динамический диапазон 2 А оказывается в 2 раз меньшим по сравнению со случаем БФМ или стандартной КФМ. Именно по этой причине КФМС была избрана для построения обратного (от МС к БС) канала в CDMA-стандарте второго поколения IS-95.

Другой вариант достижения той же цели реализован в цифровых стандартах D-AMPS (США, известен также под названиями IS-136 и US-TDMA) и PDC (Япония, прежнее наименование JDC), где вместо сдвига посылок введен поворот на угол π/4 алфавита значений фаз при переходе от четных посылок к нечетным. Благодаря такому смещению при i = 2k, k=... , -1, 0, 1, ... ϕi в (6.1)

принимает значения из множества 0, π, ±π /2, а при i = 2k +1 - из множества

±π/4, ±3π/4 (пунктир на рис. 6.2, в). Разумеется, на приемной стороне этот сдвиг легко учитывается, так что демодуляция выполняется практически так же, как при обычной КФМ. Подобный вид КФМ получил название π/4-КФМ (π/4- QPSK). Его преимущество в сравнении с КФМС состоит именно в отсутствии усложнений демодулятора, свойственных КФМС, хотя в отношении смягчения

86

требований к линейному динамическому диапазону π/4-КФМ не столь эффективна: переходам на угол ±3π/4 соответствует перепад комплексной

огибающей, равный 2 + 2 A и примерно в 1,31 раза превышающий аналогичныйпоказательКФМС.

Рассмотренные трансформации КФМ никоим образом не влияют на спектральные характеристики модулированного сигнала, которые в рамках случайной модели передаваемого потока данных определяются исключительно формой посылки. Поскольку причиной медленного спадания спектра мощности сигналов (6.1) и (6.2) с частотой является разрывность прямоугольной посылки, радикального сужения спектра можно добиться только за счет сглаживания ее формы. Если, в частности, принять в (6.2) за посылку импульс с огибающей в виде положительной полуволны косинуса (рис. 6.2) с амплитудой 2 , то КФМ преобразуется в свой подвид, известный как минимальная частотная манипуляция - МЧМ (MSK - minimal shift keying).

Для того чтобы убедиться в преимуществах МЧМ и попутно выяснить корни ее наименования, найдем комплексную огибающую S(t) сигнала (6.2) с формой посылки, задаваемой (6.3). При этом в силу полной однородности поведения сигнала во времени достаточно рассмотреть лишь два смежных

отрезка [-

/2, 0] и [0,

/2]. Используя элементарную тригонометрию, формулу

Эйлера и бинарность символов ai , bi

в силу которой

ai /bi = ai

bi =±1, получаем

 

a Acos(πt) + jb

Acos π

(t +

) =a Aexp(j

πa0b1t

),− ≤t 0,

 

 

 

 

 

 

0

1

 

 

 

 

 

0

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

S(t) =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(6.4)

 

 

 

 

 

 

 

 

=a Aexp(j πa0b0t),0 t

 

 

 

a Acos(πt) + jb Acos π

(t

)

 

 

 

 

 

 

 

0

0

 

 

 

 

0

 

 

 

 

 

 

 

2,

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

Как

показывает

(6.4),

действительная

S(t) =

 

S(t)

 

=

А постоянна и,

 

 

следовательно, МЧМ не сопровождается амплитудной модуляцией, обеспечивая равенство пик-фактора сигнала единице и, как результат, оптимальность режима усилителя мощности передатчика.

Другой вывод из (6.4) состоит в том, что рассматриваемый вид модуляции сводится, по существу, к бинарной частотной манипуляции прямоугольных посылок длительности /2, поскольку линейное изменение фазы с угловым коэффициентом ±π/ означает сдвиг частоты на +1/2 . Принципиальным является то, что переключение частоты между посылками каждые /2 с происходит без скачков фазы, т.е. МЧМ является модуляцией с непрерывной фазой. В этом легко убедиться, подставив t = 0 в обе строки (6.4) и придя к одному и тому же результату: S(t= 0-) = ao=S(t = 0+), где верхние индексы "-" и " +" символизируют приближение к точке t = 0 соответственно слева и справа.

Таким образом, при любом текущем передаваемом символе очередная посылка начинается с той фазы, которая "набежала" в течение предыдущей. Сказанное иллюстрируется "деревом" траекторий фазы на рис. 6.3. В течение каждого отрезка [k /2, (k + 1) /2] фаза линейно растет или убывает в соответствии с текущим приращением частоты +1/2 (определяемым, и свою

87

очередь, комбинацией символов ai , bi сигнала (6.2) на данном отрезке).

Значения фазового угла в момент (k + 1) /2, отвечающие двум возможным частотам, отличаются ровно на π. При этом любая из возможных траекторий фазы оказывается непрерывной функцией.

Рис. 6.3. ТраекториифазыприМЧМ

Отсутствие разрывов фазы обеспечивает спектру МЧМ значительно большую степень компактности по сравнению со стандартной КФМС: спектр мощности МЧМ сигнала убывает примерно пропорционально 1/f4, так что

занимаемая им полоса сокращается более чем на порядок: f99

1,2

 

 

Tb

Резервы дальнейшего сжатия спектра модулированного сигнала кроются в устранении разрывов не только самой фазы, но и ее производных (частоты, скорости изменения частоты и т.д.). Иными словами, линейно-ломаные траектории на рис. 6.3 могут быть заменены более гладкими. В стандарте GSM применен именно такой вариант модуляции - гауссовская МЧМ (GMSK - Gaussian MSK), при которой закон изменения фазы в течение посылки повторяет ход гауссовской интегральной функции распределения, чем обеспечивается плавность изменения фазы и частоты, а значит, высокая степень компактности спектра. Технически гауссовская (как и обычная) МЧМ может быть реализована разными средствами, однако для объяснения смысла ее параметров согласно спецификации GSM разумно считать, что исходный поток битовых прямоугольных посылок длительности Тb пропускается через низкочастотный фильтр с гауссовской амплитудночастотной характеристикой и полосой В (на уровне -3 дБ), после чего сглаженный сигнал модулирует частоту задающего генератора. В стандарте

жестко зафиксировано значение ВТb = 0,3, отвечающее полосе

f99

0,92 .

 

 

 

T

 

 

 

b

С упрощениями, игнорирующими второстепенные детали, дерево траекторий фазы гауссовской МЧМ показано на рис. 6.4.

Отметим, что в эволюции видов модуляции от БФМ до МЧМ обмен между спектральной эффективностью и достоверностью передачи фактически отсутствовал: повышение спектральной эффективности не

88

сопровождалось снижением минимального евклидова расстояния в сигнальном созвездии, что было продемонстрировано на примере сравнения КФМ с БФМ.

Рис. 6.4. ТраекториифазыпригауссовскойМЧМ

Случай гауссовской МЧМ несколько выпадает из этого ряда в связи с тем, что неограниченность отклика гауссовского фильтра во времени не позволяет, строго говоря, трактовать данный вид модуляции как сглаженную версию КФМС. В литературе можно встретить упоминание об энергетическом проигрыше гауссовской МЧМ относительно БФМ в 0,46 дБ, однако не исключено, что ее теоретический потенциал выше с учетом возможности демодуляции сообщения "в целом", т.е. на интервале, охватывающем

несколько посылок (например, с помощью алгоритма Витерби).

 

 

Приведем итоговую таблицу, связывающую ширину

полосы

f99

модулированного сигнала со скоростью передачи данных

Rt (бит/с)

для

рассмотренных форматов.

 

 

 

 

Таблица 6.1 показывает соотношения между полосой и скоростью

передачи для различных видов модуляции.

 

 

 

 

 

Табл. 6.1. Виды модуляций и их параметры

Вид

БФМ

КФМ, КФМС,

МЧМ

Гауссовская

модуляции

 

π/4-КФМ

 

МЧМ

 

 

 

 

 

 

 

f99 / Rt

18,5

9,2

1,2

0,92

 

 

 

 

 

 

 

Как показывает приведенный обзор, даже в относительно узких рамках цифровых стандартов сотового радиотелефона применяемые методы модуляции отличаются заметным разнообразием. Их перечень станет еще более обширным, если обратиться и к другим телекоммуникационным системам (модемной, радиорелейной, спутниковой связи, персонального вызова, бесшнурового телефона и т.п.). Все это лишний раз свидетельствует о неоднозначности и многовариантности задач проектирования и существовании параллельных путей достижения оптимальных системных показателей.

89