Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
13.47 Mб
Скачать

Таким образом, мы можем сделать вывод, что для восприятия словесного ударения существенна только длительность гласного в слоге.

Экспериментально полученные гистограммы ответов «второй слог ударный» (рис. 5.4, Б) дают возможность оценить величину дифференциального порога по длительности, когда сигналы (глас­ ные в слогах) сравниваются по критерию «ударный—безударный». В первом приближении эта величина может служить мерой точ­ ности измерения длительности при восприятии человеком просо­ дических признаков речи.

Независимость восприятия уда­ рения от длительности согласного

Рис. 5.5. Частота ответов «второй слог ударный» при разных длительностях вто­ рого гласного в синтетической последова­ тельности [sasasa].

По оси абсцисс — длительность второго гласного; по оси ординат — частота ответов. Усредненные данные для длительностей второго согласного 80, 100 и 120 мс.

(при малых длительностях последнего) дает возможность объединить экспериментальные результаты для длительностей согласного до 120 мс включительно и построить суммарную ги-. стограмму ответов «второй слог ударный» (рис. 5.5). Аппроксима­ ция этой гистограммы интегральной кривой нормального распре­

деления вероятностей

дает нам

длительность

второго гласного

в последовательности

[sasasa],

при

которой

первые

два слога

воспринимаются равноударенными,

7\. — 150

мс и

среднеквад­

ратическое отклонение а = 17 мс. Зная эти величины, мы можем определить величину дифференциального порога (ДП) и относи­ тельного дифференциального порога (ОДП):

ДП = 0.675о = 11.5 мс, ОДП = ДГ1,ГР = 0.077 (7.7%).

Полученная таким образом величина относительного диффе­ ренциального порога совпадает с имеющимися в литературе дан­ ными об относительных порогах по длительности, полученных в результате субъективного сравнения длительностей ]173’ 223> 267].

Таким образом, изложенные выше экспериментальные резуль­ таты позволяют сделать вывод, что длительность гласного в слоге является признаком словесного ударения, и при этом точность принятия решения о месте словесного ударения определяется в ос­ новном точностью субъективного измерения длительностей.

103

5.2.2. РЕЧЕВОЙ ТЕМП

Выше было показано, что для выделения элементов слова (гласных (согласных) или слогов) может быть использована длительность этих элементов. Оказывается, что аналогичный способ выделения используется'и на более высоком уровне: для выделения слов и словосочетаний во фразе тоже используется длительность [76, 78> 132’ 159> 205> 244). Такое выделение называется фразовым (логическим) ударением, и при этом в той или иной степени изменяются длительности всех составляющих слово звуков. Можно предположить, что наиболее простым способом реализации такого изменения длительности при речеобразовании и, соответственно, наиболее простым признаком, используемым при восприятии, было бы изменение темпа произнесения слов.

Известно, что темп речи может быть использован и как один из признаков при опознавании индивидуальности диктора, а в ряде случаев его изменения могут служить показателем эмоционального и даже физического состояния диктора. Вероятно, узнавая на слух конкретного диктора по характерному для него темпу речи, мы пользуемся некоторой средней величиной, полученной в ре­ зультате анализа достаточно большого отрезка речевого сигнала.

Напротив, для обнаружения логической выделенности слова во фразе необходимо установить, в каком темпе было произнесено именно это слово. Использование для этой цели средних значений темпа на некотором интервале предполагало бы членение речевого потока на слова до начала измерения. Но членение на слова воз­ можно только на этапе лингвистического анализа (см. главу 2), а к этому моменту все измерения в речевом сигнале должны быть закончены. Видимо, преодолеть это противоречие можно при использовании параметра типа «мгновенного» темпа. Измеряя величину «мгновенного» темпа и записывая ее в оперативную память одновременно с фонемной информацией, мы получили бы возможность сравнивать величины «мгновенных» темпов по обе стороны словесной границы, обнаруживаемой при лингви­ стическом анализе, и тем самым — оценивать степень выделен­ ное™ слов во фразе. Кроме того, не исключено, что в некоторых случаях резкое изменение величины «мгновенного» темпа само могло бы служить пограничным сигналом.

Попытаемся установить, что могло бы быть мерой «мгновен­ ного» темпа в речевом сигнале. Обычно принято характеризовать темп речи на заданном отрезке средним числом некоторых эле­ ментов речевого потока, произнесенных в единицу времени. В зависимости от конкретных задач применяемые элементы могут быть различны: от фразы до фонемы [533]. Однако большинство исследователей пользуется для этой цели слогом. Анализ различ­ ных элементов речевого потока с точки зрения получения мини­ мального коэффициента вариации их длительности при поддер­ жании постоянного темпа и возможности измерения с их помощью

104

темпа сравнительно коротких отрезков речевого сигнала показал, что этим условиям наиболее полно удовлетворяет слог [148].

Исследователь, измеряющий темп речи по осциллограмме или по динамической спектрограмме, может в равной степени поль­ зоваться для определения темпа и понятием частоты (число слогов в единицу времени), и понятием периода — длительности слога. Однако предположение, что при восприятии темпа человек ис­ пользует процедуру подсчета числа слогов, произнесенных за эталонный интервал времени, представляется в высшей степени невероятным. К такому же выводу приводят и некоторые резуль­ таты психофизических экспериментов с периодическими сигналами [478]. Вместе с тем известно, что человек способен с достаточно высокой точ­ ностью измерять интервалы времени (длительности звуков, интервал между двумя щелчками или посылками тона или

Рис. 5.6. Зависимость субъективной величины темпа от длительности периода следования посылок гласного в стимуле (1) и от длитель­ ности самого гласного (2).

По оси абсцисс — длительность гласного или периода их следования; по оси ординат — субъективное «рас­

стояние» между стандартным и тестовым стимулами (в средиеквадратичсских отклонениях).

шума) [150' 173, 223’ 267]. Поэтому более естественным кажется пред­ положение, что субъективная оценка темпа слушателями бази­ руется на измерении периода, т. е. длительности слога.

Интересны в этом отношении результаты выполненного Венцовым эксперимента по психологическому шкалированию темпа последовательностей, образованных из четырех посылок синте­ тического гласного. Испытуемым предъявлялась таблица запи­ санных на магнитную ленту стимулов, в которой либо изменялся период следования посылок гласного (от 150 до 350 мс) при посто­ янной длительности посылки гласного (100 мс), либо изменялась длительность посылки гласного (от 100 до 250 мс) при постоянном периоде следования этих посылок — 300 мс. Испытуемые должны были оценить темп каждого стимула в баллах от 1 до 7. Результаты эксперимента, приведенные на рис. 5.6, показывают, что субъек­ тивные оценки темпа таких синтетических последовательностей являются линейной функцией периода следования гласных в них, т. е. длительности интервала «гласный-рпауза», и не зависят от длительности образующих стимул гласных при постоянном периоде их следования.

Так как интервал «гласный+пауза» соответствует в речевой! сигнале слогу, а также принимая во внимание сказанное выше

105

о слоге как о том минимальном элементе речевого потока, которым определяется темп, мы можем принять, что мерой «мгновенного» темпа является период следования гласных, который в большин­ стве случаев есть не что иное, как длительность слога. Существенно отметить, что при таком определении «мгновенного» темпа мы в то же время не теряем возможности пользоваться и понятием среднего темпа, определяемого ь’ак средняя длительность слога на заданном отрезке речевого сигнала.

Если «мгновенный» темп определяется длительностью слога и в качестве меры точности его субъективной оценки принята величина относительного дифференциального порога, то следует ожидать, что точность измерения темпа будет равна точности субъ­ ективной оценки человеком длительности (относительный диффе­ ренциальный порог 5—15%). Хотя интуитивно очевидно, что слушатель в состоянии воспринять темп даже изолированно произнесенного двусложного слова, например иду, имеющего всего

Таблица 5.1

Относительный (в процентах) дифференциальный порог по периодичности. Данные разных авторов

Период,

Миллер

Поллак

Маубрей

Крылов

Мичон

мс

и Тейлор L385]

[«.]

и др. [309]

[8<]

[*•]

 

 

3.1213.1

4.1623.5

5.4 — 2.46

6.2523.7

8.3

21.4

3.71

12.519.4

21.7 — 3.76

25.015.6

31.2

3.18

0.8

 

 

50

13.8

 

2.3

67

100

1.85

0.8

0.9

143

0.84

156

2.70

0.8

4.9

0.86

200

250

3.10

0.96

333

1.82

400

3.42

1.2

5.9

1.85

500

667

1.96

1000

2.0

8.0

1.85

1430

2.98

2000

8.8

3.70

2500

8.05

 

 

 

2700

6.3

Примечание. Величину дифференциального порога, полученную Поллаком для периода 2500 мс, правильнее было бы отнести к дифференциальному порогу по длительности, так как по условиям его эксперимента при этой величине периода нслытуемым предъявлялся всего один интервал и о периоде в этом случае не могло быть и речи.

106

один период, обычно принято считать, что темп характеризует сравнительно длинную последовательность повторяющихся ин­ тервалов. Соответственно этому при оценке точности восприятия темпа в неречевых сигналах использовались последовательности неограниченной длины из периодически повторяющихся интерва­ лов: определялся дифференциальный порог по периодичности. Результаты этих работ приведены в табл. 5.1 и на рис. 5.7. Видно, что в диапазоне характерных для речи темпов (максимальный темп — 12 слогов/с, период следования гласных 83 мс [73, 467, 533]; минимальный — 120 слогов/мин, период — 500 мс [4]) относитель­ ный дифференциальный порог составляет 1—6%. Можно предпо-

Рис. 5.7. Зависимость относительного дифференциального порога ио пе­ риодичности от длительности периода.

По оси абсцисс — длительность периода; по оси ординат — относительный дифференци­ альный порог. Данные разных авторов: 1 — [Э85]; 2 — [в*]; 3 — [*26]; 4 — [384]; 5 — Р’8].

дожить, что в основе этих различий между дифференциальными порогами по длительности и периодичности лежит известный в психоакустике эффект накопления, заключающийся в повыше­ нии точности субъективных оценок, в частности высоты, с увели­ чением числа доступных системе отсчетов данного параметра. Так, восприятие высоты оказывается невозможным при числе периодов меньшем трех [428].

Если такое предположение правильно, точность субъективной оценки слушателем темпа последовательности гласных должна возрастать по мере увеличения в ней числа интервалов между гласными (количества гласных в последовательности). Именно такой результат (рис. 5.8) был получен в эксперименте, где от испытуемого требовалось уравнять темп стандартной и тестовой последовательностей, изменяя период следования гласных в по­ следней. Количество последовательных интервалов между глас­ ными в стандартном и тестовом стимулах было одинаковым и из­ менялось от опыта к опыту от одного до трех. Измерения точности установки были проведены для 2 значений периода следования

107

гласных 200 и 300 мс при длительности самого гласного 100 мс. Каждый испытуемый проводил по 15 установок для каждого из периодов при данном числе периодов в стимуле. В качестве меры точности установки использовалась абсолютная величина разности длительностей стандартного и установленного испытуемым пе­ риодов следования гласных, выраженная в процентах от длитель­ ности стандартного периода.

Рис. 5.8. Точность восприятия темпа при разном числе измеряемых перио­ дов в сигнале.

По оси"абсцисс — относительная ошибка уравнивания темпов; по оси ординат — относи­ тельное число случаев, когда ошибка не превышает данную. Точки— при одном периоде, крестики— при двух периодах, кружки — при трех. Данные четырех испытуемых.

Надо сказать, что полученная в таком эксперименте точность уравнивания темпов может быть использована в качестве меры точности восприятия темпа в речи с большими оговорками, так как неизвестен критерий, используемый испытуемым при принятии решения о равенстве темпов. Однако в первом приближении эти результаты все же дают представление о характере возрастания точности с увеличением числа доступных измерению периодов, особенно если данные разных испытуемых анализировать порознь.

Причины повышения точности субъективной оценки темпа при увеличении числа измеряемых интервалов еще не выяснены.

Можно предположить, что это явление так или иначе

связано

с памятью, но на основании имеющихся данных нельзя

сказать,

производится ли при этом усреднение измеряемых величин или многомерное описание последовательности с одновременным ис­ пользованием сведений обо всех измеренных интервалах. Тем не менее необходимо иметь в виду, что, говоря о точности субъек­

тивной оценки периодичности или темпа, необходимо указывать, при каком числе последовательных периодов в сигнале получена эта точность.

Высокая точность восприятия периодичности (низкие диффе­ ренциальные пороги) в психоакустических экспериментах с нере­ чевыми сигналами могла быть следствием использования в этих экспериментах стимулов с максимально стабильными периодами следования посылок. Какова будет точность восприятия темпа последовательностей с нестационарным периодом следования гласных, свойственных естественной речи, сейчас сказать невоз­ можно, так как исследование такого рода сигналов только на­ чинается [94, 43°]. Очевидно, что применительно к восприятию ре­ чевого темпа данные о дифференциальных порогах по периодич­ ности могут быть использованы лишь в качестве нижнего предела возможных ошибок измерения темпа.

В заключение необходимо сказать, что возможность исполь­ зования «мгновенного» темпа — длительности слога — в качестве одного из просодических признаков кажется вполне правдоподоб­ ной, хотя прямых доказательств этого пока нет. Надо отметить также, что в определении «мгновенного» темпа как периода следо­ вания гласных содержится некоторая неопределенность: так как при сегментации речевого потока выделяются и начало, и конец гласного (см. главу 3), этот период может измеряться от начала до начала последовательных гласных, что соответствует закрытому слогу, или от конца до конца (открытый слог). Какой из периодов используется при восприятии темпа естественной речи, неизвестно. Не исключено, однако, что в зависимости от конкретных условий человек может пользоваться любым из этих периодов.

5.2.3. ДЛИТЕЛЬНОСТЬ СОГЛАСНОГО КАК ПРИЗНАК СЛОВЕСНОЙ ГРАНИЦЫ

Б предыдущих разделах мы установили, что длитель­ ность слога может быть использована в качестве меры темпа речи, а длительность гласного в слоге определяет место словесного ударения. Естественно, возникает вопрос, не используется ли и длительность согласного в качестве просодического признака и, если используется, то какого рода информацию она несет. Разу­ меется, под длительностью согласного в данном случае мы пони­ маем длительность интервала от конца одного гласного до начала следующего, вне зависимости от того, каким числом согласных фонем будет описан этот интервал при его записи в оперативную память.

В работе Пикетта и Декера [421] впервые было показано, что длительность согласного может служить признаком словесной границы. При увеличении длительности смычки глухого взрывного согласного [р] в слове topic (в эксперименте изменялась длитель­ ность паузы между концом предшествующего гласного и взрывом

109

согласного путем вклеивания отрезков чистой магнитной ленты разной длины) испытуемые начинают воспринимать этот соглас­ ный как двойной (рис. 5.9). Так как в английском языке нет дол­ гих и кратких согласных, это приводило к членению исходного слова topic на два слова— top pick, при условии, конечно, что такое

членение не противоречило смыс­

лу

той

фразы, в которой это

слово было произнесено.

себе,

 

Можно

представить

что

при

восприятии

таких

долгих

согласных в оператив­

ную память записывается либо два согласных, либо один со­

гласный с

указанием его

дли­

тельности.

Для выбора

одной

из

этих

возможностей

пока

нет

достаточного количества

Рис. 5.9. Зависимость частоты ответов «одинарный согласный» от длитель­ ности согласного. По [421].

На А — при изменении длительности взрывного согласного [р] во фразе Не was the topic of the year, произнесенной разными дикторами (кривые 1 и 2}. На Б — то же для фразы Не was the topic for discussion. Но оси абсцисс — длительность фазы смычки взрывного со­ гласного; по оси ординат — частота опознавания согласного как одинарного,

Рис. 5.10, Длительность фазы смычки взрывного согласного как функция темпа речи. По [421].

По оси абсцисс — темп речи; по оси ординат — длительность смычки, 7 — длительность смычки, при которой в 60% случаев испытуемые оценивали согласный как одинарный; 2 — длительность одинарного согласного в естественной речи.

данных, но ясно, что записи в память в обоих случаях должно предшествовать нормирование измеренной длительности согласного по темпу речи (рис. 5.10), хотя совершенно неясно, каким темпом надо пользоваться при нормировании («мгновенным» или средним), а если средним, то на каком интервале его надо измерять.

Появление словесной границы при увеличении длительности согласного наблюдалось и при восприятии носителями русского

110

языка синтетической звуковой последовательности [sasasa] ]31]: увеличение длительности второго согласного приводит к тому, что в этой последовательности испытуемые слышат два ударных глас­ ных одновременно.2 *По правилам русского языка это означает, что данная последовательность воспринимается состоящей из двух слов (рис. 5.11). Весьма примечательно то обстоятельство, что при посто­ янной длительности слога (этому условию соответствуют длитель­ ности гласного и согласного, представленные прямой аб в плоско­ сти 7\ Тс) именно длительность согласного является тем парамет­ ром, изменение которого приводит к восприятию в данной последо-

Рис. 5.11. Членение синтетической последовательности на два «слова» при разных длительностях согласного и гласного во втором слоге.

По оси абсцисс — длительность второго гласного; по оси'ординат — длительность второго согласного; по вертикали — относительное число Случаев, в которых последовательность воспринималась состоящей из двух «слов». Прямая аб описывается уравнением Тг+Тс = =const.

вательности двух слов. Однако при больших длительностях глас­ ного (больше 200 мс) увеличение длительности согласного уже не приводит к стопроцентному членению последовательности на два слова из-за появления ответов испытуемых «второй слог ударный». Причина этого заключается, по всей вероятности, в том, что для восприятия двух слов в такой последовательности параметры входящих в нее гласных (в данном случае их длитель­ ности) должны допускать возможность восприятия двух ударных гласных при соответствующей длительности согласного. Видимо, это условие перестает соблюдаться в полной мере, когда длитель­ ность второго гласного существенно превосходит длительности остальных гласных и он-то и воспринимается как главноударный. При этом, естественно, появляются ответы «второй слог ударный»

вместо ответов

«два слова».

2 Параметры

гласных и согласных в последовательности приведены

в разделе 5.2.1.

 

111

Интересно отметить, что при существенном различии между русским и английским языком (в английском нет долгих и крат­ ких согласных, а в русском они есть [113]) зависимости вероятности появления словесной границы от длительности согласного оказы­ ваются принципиально одинаковыми (ср. рис. 5.9 и рис. 5.12). Зависимости эти отличает, при всем их сходстве с обычной психо­ метрической функцией, чрезмерно затянутый «хвост» при боль­ ших длительностях согласного. Это означает, что стопроцентное членение может не достигаться даже при очень больших длитель­ ностях согласного. Удовлетворительного объяснения этому явле­ нию в настоящее время не существует.

Рис. 5.12. Зависимость членения исходной последовательности [sasasa] на два «слова» от длительности согласного.

По оси абсцисс — длительность второго согласного*, по оси ординат — относительное число членений. 1 — при длительности второго гласного 90 мс; 2 — при длительности

второго гласного 190 мс.

В заключение необходимо сказать, что длительность соглас­ ного не единственный признак словесной границы: в ряде случаев признаком границы служит появление так называемых погранич­ ных аллофонов, а также образование паузы между двумя следую­ щими друг за другом звуками.

Аллофонные изменения на границах заключаются в том, что звуки, между которыми проходит граница, как правило, имеют более четкую формантную структуру, не оказывают друг на друга влияний типа коартикуляции и имеют большую длительность pis, 270, 342. 343] Результаты эти получены путем анализа акусти­ ческого сигнала и параметров звуков в тех случаях, когда слу­ шатели четко устанавливали наличие в этом месте грапицы. Правил синтеза этих пограничных аллофонов в настоящее время не существует, и вопрос о том, насколько надо изменить дли­ тельность звука, чтобы он превратился в пограничный аллофон, совершенно не исследован.

Пауза чаще всего появляется в случаях, когда граница про­ ходит между двумя фонетически различными звуками. При на-112

112

Соседние файлы в папке Нормальная физиология