Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Semestrovaya_rabota.docx
Скачиваний:
120
Добавлен:
14.03.2016
Размер:
69.67 Кб
Скачать

Система анализа речи

Си́нтез ре́чи — в широком смысле — восстановление формы речевого сигнала по его параметрам; в узком смысле — формирование речевого сигнала по печатному тексту.

Синтезом речи — прежде всего называется всё, что связано с искусственным производством человеческой речи.

Голосовой движок — система преобразования текста/команд в речь, может существовать независимо от компьютера.

Speereo Speech Recognition

Распознавание речи происходит непосредственно на устройстве, а не на сервере, что является ключевым преимуществом, по мнению разработчиков.

Характеристики:

- распознавание русской речи работает с надежностью около 95%;

- дикторонезависимость;

- словарный запас около 150 тыс. слов;

- одновременная поддержка нескольких языков;

- компактный размер движка.Sakrament ASR Engine (разработка компании «Сакрамент»)

Осуществляет высокоточное распознавание речи на различных платформах.

Технология распознавания речи используется при создании средств речевого

управления – программ, управляющих действиями компьютера или другого

электронного устройства с помощью голосовых команд, а также при организации

телефонных справочных и информационных служб.

Характеристики:

-дикторонезависимость;

- языконезависимость;

- точность распознавания достигает 95-98%;

- распознавание речи в виде выражений и небольших предложений;

- нет возможности обучения.

VoiceNavigator

Это высокотехнологичное решение для контакт-центров, предназначенное для

построения Систем Голосового Самообслуживания (СГС).VoiceNavigator позволяет

автоматически обрабатывать вызовы с помощью технологий синтеза и распознавания

речи.

Характеристики:

- дикторонезависимость;

- устойчивость к окружающим шумам и помехам в телефонном канале;

- распознавание русской речи работает с надежностью 97% на словаре в 100

слов;

Loquendo asr

Дикторонезависимая система, оптимизированная для использования в телефонии. Предусмотрена возможность распознавания отдельных слов и речи, поиска ключевых слов (словарь до 500 слов). Позволяет создавать дружественные пользователю приложения за счет большого объема словаря и гибкости системы.

Поддерживает 12 языков, включая наиболее распространенные европейские языки (итальянский, испанский, английский, французский, немецкий, греческий, шведский и др.).

Входит в состав продукта Loquendo Speech Suite вместе с системой text-to-speech и программой Loquendo VoiceXML Interpreter, поддерживающей использование различных голосов и языков.

Google Voice Search

С недавнего времени голосовой поиск от Google встроен в

браузер Google Chrome, что позволяет использовать этот сервис на различных

платформах.

Характеристики:

- поддержка русского языка;

- возможность встраивать распознавание речи на веб-ресурсы;

- голосовые команды, словосочетания;

- для работы необходимо постоянное подключение к сети internet.

Способы анализа речи можно разделить на группы:

  • конкатенативный, или компиляционный (компилятивный) синтез;

  • параметрический синтез;

  • предметно-ориентированный синтез.

  • синтез по правилам;

Компиляционный синтез

Компиляционный синтез сводится к составлению сообщения из предварительно записанного словаря исходных элементов синтеза. Размер элементов синтеза не меньше слова. Очевидно, что содержание синтезируемых сообщений фиксируется объёмом словаря. Как правило, число единиц словаря не превышает нескольких сотен слов. Основная проблема в компилятивном синтезе — объёмы памяти для хранения словаря. В этой связи используются разнообразные методы сжатия/кодирования речевого сигнала. Компилятивный синтез имеет широкое практическое применение. В западных странах разнообразные устройства (от военных самолётов до бытовых устройств) оснащаются системами речевого ответа. В России системы речевого ответа до недавнего времени использовались в основном в области военной техники, сейчас они находят всё большее применение в повседневной жизни, например, в справочных службах операторов сотовой связи при получении информации о состоянии счета абонента.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]