Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4.b._Konspekt2.doc
Скачиваний:
116
Добавлен:
22.08.2013
Размер:
5.43 Mб
Скачать

Процесс речеобразования и звуки речи

Речеобразование является одним из сложнейших психофизиологи-ческих процессов. В нём тесно переплетены уровни создания звуков, слов, фраз, передачи смысла. Внешней,акустической речи предшествует этап так называемойвнутренней речи. Внутриречевая программа будущего высказывания складывается из «смысловых вех», то есть включает в себя корреляты отдельных, особенно важных для высказывания компонентов.

Речевой аппарат человека условно можно разделить на источниквозбуждения звука– органы дыхания, голосовая щель иречевой тракт– полости рта и носа. Подвижные органы речевого тракта называютартикуляционнымиорганами (в основном это язык, губы, мягкое нёбо, нижняя челюсть).

Звуки речи возникают обычно на выдохе. Возбуждение звуков может быть тональным илишумовым.

В первом случае, создавая давление воздуха в лёгких и напрягая голосовые связки, мы вызываем колебательные движения этих связок. В результате в речевой тракт поступают импульсы воздуха, их частота зави-сит главным образом от перепада давления воздуха до и после голосовой щели, от массы и размера голосовых связок, от степени их напряжения. Эта частота и определяет высоту тона голоса.

Во втором случае связки не напряжены, свободная струя воздуха, не встречая на пути препятствия, создаёт шум.

Выходной звук определяется характером возбуждения и конфигура-цией речевого тракта. Если при тональном возбужденииконфигурация речевого тракта представляет как бы набор резонансных полостей, то на выходе образуются сложные колебания, содержащие гармоники (обертоны) основного тона.Состав обертонов и определяет тот или иной гласный звук.

Если же при тональном возбуждениив речевом тракте создано су-щественное сужение, то выходной сигнал будет содержать как гармоническую (тональную) компоненту, так и шумовую, что характери- зуетзвонкие согласные(например,з. ж).

В случае шумового источникаобразуютсяглухие согласные(например, с, ш).

Особое место в речеобразовании занимает динамика работыарти-куляционных органов.Некоторые звуки могут быть произнесены пристатическом положении речевого тракта, это так называемые протяж-ные звуки (например,а, о, с, х). Другие звуки характеризуются опреде-лённой динамикой органов артикуляции. Например, звукц характеризу-ется предварительным полным перекрытием речевого тракта и затем резким нарастанием шумовой составляющей. Этот звук невозможно тянуть или произносить медленно.

Важно также заметить, что в процессе речи речевой тракт находится в постоянной перестройке, что ведёт к значительному взаимному перекрытию отдельных звуков и отсутствию физически очевидных межзвуковых границ. Это составляет важную особенность речевого сигнала, которую необходимо учитывать как при распознавании, так и при синтезе речи.

Основной единицей звукового строя языка является фонема. Звуковой состав различных языков имеет свои особенности. В русском языке насчитывают 41 фонему [1]. Это деление условно и может подвергаться сомнениям, как любое деление сложного процесса на части.

Многие согласные буквы имеют два фонетических аналога: твёрдый и мягкий. Некоторые гласные буквы (дифтонги, в ряде публикаций их называют дифонами), напротив, не имеют фонетических аналогов, а отображаются двойными звуками (j+гласный, например, я=j+а, ю=j).

При изучении письменной речи мы постепенно осваиваем эти сложные соотношения между тем, что пишется, и что произносится (и слышится). С этой точки зрения фонетическая транскрипция «называет вещи своими именами», непосредственно указывая, что именно надо произносить, не прибегая к анализу звукового контекста и других факторов. Фонетический текст служит основой при построении некоторых типов синтезаторов речи

Чтобы показать соотношение фонетического содержания речи и письменного текста сравним соответствующие описания фрагмента тек- ста [2].

Орфографическая форма:

«В одной из отдалённых улиц Москвы, в сером доме с белыми колоннами, антресолью и покривившимся балконом жила некогда барыня-вдова, окружённая многочисленной дворней».

Фонетическая форма:

«ва-дной-из-ад-да-лен-ных у-лиц ма-сквы, фсе-рам до-ме збе-лы-ми ка-лон-на-ми, а-нтре-соль-jу и па-кри-виф-шы-мся-ба-лко-нам, жы-ла не-ка-гда ба-ры-ня-вда-ва, а-кру-жон-наjа мна-га-чис-лен-най двор-ней»

Как видно из фонетической формы, построенной на основе одного из диалектов русского языка – московского диалекта, распознавание речи представляет собой очень сложную проблему.

Понятие «фонема» может рассматриваться как абстрактное, типизи-рованное представление звука языка. В живой речи существует, однако, бесчисленное множество разнообразных физических реализаций каждой фонемы. Одна из главных закономерностей в изменчивости фонем – это влияние соседних звуков. Разновидности фонемы, обусловленные звуковым окружением, называют её «аллофонами». С учётом аллофонов звуковой состав речи может насчитывать 100 – 140 и более различных звуков.

Другие систематические факторы изменчивости фонем – это индиви-дуальные особенности артикуляции, местные диалекты, пол, возраст.

В силу всех этих причин речевой сигнал считают квазислучайным, обладающим регулярной и случайной компонентами, что важно учитывать при автоматическом распознавании речи и речевом синтезе.

Фонемы можно классифицировать на основе различных подходов: артикуляционного, слуховогоитехнического.

При артикуляционном подходепризнаками фонем являются факты, связанные с движением (или положением) речеобразующих подвижных органов [1]. Гласные фонемы различают при этом по степени подъёма языка, по степени его продвинутости вперёд-назад, по участию губ. Например, звук«а»является гласным низкого подъёма (или открытым), заднего ряда, не огублённым (губы не участвуют).

Согласные фонемы характеризуют признаками места (при помощи какого действующего органа они образуются – губные, переднеязычные, среднеязычные, заднеязычные), способом образования звука (сближение произносительных органов, смыкание-размыкание, дрожание), наличием голосового источника (звонкие, глухие), твёрдостью-мягкостью, участием-неучастием носовой полости (ротовые, нозальные).Звук «б», например, является губным по месту образования, взрывным по способу образования, звонким по участию голосового источника (голосовой щели), мягким, ротовым.

Слуховой подходк классификации звуков основан на выделении таких признаков, как звонкость, шумность, нозальность (участии полости носа), компактность и др. Эти признаки определяются методами психоакустики.

Технический подходоснован на описании фонемсовокупностью измеренных параметров. Это могут быть последовательности спектральных отсчётов, формантные частоты (см. ниже) и ряд других. В любом случае эти описания приводят к сложным алгоритмам распознавания фонем.

Соседние файлы в предмете Системы ввода и вывода данных