Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Кодзасов, Кривнова - Общая фонетика

.pdf
Скачиваний:
2773
Добавлен:
11.02.2015
Размер:
12.91 Mб
Скачать

Глава 3. Акустика речи

различных языках учитываются квантальные артикуляци- онно-акустические отношения: для разных звуков исполь­ зуются прежде всего те артикуляции, которым соответству­ ют квантальные акустические различия. Принцип квантальности действует и при произнесении звуковых после­ довательностей. При непрерывной и плавной перестройке артикуляционных органов в определенные моменты време­ ни либо резко изменяется акустическая картина речи (вне­ запно меняется источник звука и/или передаточная функ­ ция), либо какие-то важные акустические параметры (на­ пример, частоты формант) имеют локальные максимумы или минимумы. Подобные временные точки обладают осо­ бой значимостью для восприятия речи: их окрестности происходят такие изменения акустических параметров, ко­ торые несут наиболее существенную информацию о линг­ вистических признаках звуковых единиц, образующих ре­ чевое сообщение. По мнению Стивенса, организация зву­ ковых последовательностей с учетом квантальных артику- ляционно-акустических и акустико-слуховых отношений является основой формирования дискретных звуковых форм в языке.

Источники сведений о резонансной системе речевого тракта

Для получения сведений о передаточной функции ре­ чевого тракта используются рентгенографические и спектро­ графические данные.

Рентгенографические сведения служат основой для представления конфигурации речевого тракта в виде функ­ ции площади, характеризующей изменение поперечного се­ чения тракта вдоль его длины. Далее выбирается базовая акустическая модель резонаторной системы и, исходя из геометрических параметров тракта при произнесении рас­ сматриваемого звука, осуществляется количественный рас­ чет его передаточной функции. Иллюстрацией такого подхо­ да является исследование Г. Фанта [Фант 1964], выполнен­ ное на материале звуков русского языка. Оно может служить примером математического моделирования сложных акусти­ ческих процессов, происходящих в речевом тракте при арти­ куляции. Технические трудности, связанные с применением кинорентгена, накладывают сильные ограничения на ис-

142

Глава 3. Акустика речи

Рис. 3.19. Осциллограмма слова малина

зованы с помощью голосового источника. Здесь тоже мож­ но наметить границы между звуками, опираясь на различия в амплитуде и зная, что сонорные согласные обычно менее интенсивны, чем гласные. Очевидно, однако, что границы на этой осциллограмме менее резкие и отчетливые (см. ни­ же рис. на котором приводится членение осциллограм­ мы и спектрограммы этого слова).

Существенный недостаток осциллограмм состоит в том, что по ним трудно, а порой и невозможно определить акустические характеристики, которыми звуки одного клас­ са (с одним и тем же источником) отличаются друг от дру­ га. Такие характеристики задаются передаточной функцией речевого тракта и могут быть получены только из спектраль­ ного представления речевого сигнала.

3.3.2. Спектральное представление речевого сигнала

Спектрограммой (от лат. spectrum "видимое" грамма "запись") называется графическое изображение спектра зву­ ковых колебаний. В акустической фонетике рассматривают­ ся только амплитудно-частотные спектры звуков P(f) и соот­ ветствующие им Такие спектрограммы по­ казывают относительную амплитуду (или интенсивность) частотных составляющих звука или, что то же самое, распре­ деление общей энергии звукового колебания по частотам.

О роли фазовых характеристик составляющих сложного звука говорится в приложении.

146

Глава 3. Акустика речи

ны в 1946 г. в США et 1946], и это стало важным событием для фонетической науки. Чуть позже американ­ ские исследователи Р. Г. Копп и Г. Грин опублико­ вали книгу под названием "Видимая речь" [Potter et al.

в которой впервые были представлены динамические спектрограммы звуков, слогов, слов и фраз английского и ряда других языков. С помощью метода динамической спек­ трографии были получены все серьезные результаты в аку­ стической фонетике, а современные фонетические учебники содержат обычно много динамических спектрограмм в каче­ стве иллюстративного материала.

Динамическая спектрограмма — это трехмерное спект­ рально-временное изображение речевого сигнала. Горизон­ тальная ось изображения соответствует времени, вертикаль­ ная — частоте колебаний, а различия в интенсивности спек­ тральных составляющих отражаются в степени затемнения (яркости) изображения в соответствующих частотных облас­ тях. Динамические спектрограммы могут изображаться и в виде действительно трехмерных картинок, где интенсивно­ сти соответствует своя координатная ось. Однако в фонети­ ческой практике подобные трехмерные картинки использу­ ются редко.

Динамические спектрограммы в их классическом вари­ анте не дают представления о точных значениях интенсив­ ности спектральных составляющих на отдельных участках речевого сигнала. Для получения этой информации прихо­ дится обращаться к спектральным срезам. По срезу можно получить спектральную огибающую для анализируемого от­ резка сигнала, в которой выделяются отчетливые резонанс­ ные максимумы. Их относительная интенсивность может быть точно измерена. Современные средства спектрального анализа речи, в том числе компьютерные, дают возможность получать как динамические спектрограммы, так и мгновен­ ные спектры.

Узкополосные и широкополосные спектрограммы

Различие между узкополосными и широкополосными

спектрограммами связано с характеристикой основного тех­ нического элемента спектроанализатора — полосой пропус­ кания анализирующего фильтра.

В приборных спектроанализаторах фильтр представля­ ет собой электрический резонатор, функционирование кото-

148

Глава 3. Акустика речи

Рис. 3.20. Полосовая фильтрация рече­ вого сигнала

гласных и сонорных согласных. Если ширина фильтра мень­ ше расстояния между гармониками голосового источника, фильтр будет выделять каждую отдельную гармонику анали­ зируемого сигнала. Если же ширина фильтра больше этого расстояния, фильтр будет выделять все соседние гармоники, частоты которых попадут в полосу пропускания. Рис. 3.21 иллюстрирует различия в разрешающей способности по ча­ стоте узкополосного (45 Гц) и широкополосного (300 Гц) фильтров на примере анализа сложного периодического зву­ ка с основной частотой 100 Гц.

В фонетических исследованиях узкополосный спект­ ральный анализ обычно осуществляется с помощью фильт­ ра шириной 45 Гц. Основная частота голоса у людей, даже у мужчин с очень низким голосом, почти никогда не бывает меньше 50 Гц. такой фильтр позволяет полу­ чать информацию об отдельных гармониках речевого сигна­ ла для любого говорящего. Узкополосные спектрограммы удобны при анализе изменений основной частоты голоса, т. е. прежде всего в интонационных исследованиях. Однако они не очень подходят для анализа спектральных различий между звуками речи, так как гармоническая структура спек­ тра затемняет его формантную картину.

При широкополосном спектральном анализе обычно используют фильтр шириной 300 Гц. Фильтр с такой шири­ ной полосы не выделяет отдельных гармоник в сигнале, ес­ ли основная частота не превышает 300 Гц, что характерно

150