Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Компьютерный синтез речи. Realspeak Solo Katerina.doc
Скачиваний:
74
Добавлен:
01.05.2014
Размер:
441.34 Кб
Скачать
  1. Тестирование по

    1. Описание системы

RealSpeakSoloфирмыNuanceэто преобразователь Текст-в-Речь, разработанный для применения в приложениях с голосовыми функциями, которые предназначены для рынков мобильных устройств и автомобильных рынков. TTS или синтезатор речи может получать исходный текст из разнообразных источников, таких как базы данных, почтовые программы, SMS и т.д. и конвертировать его натуральную речь в автомобильных навигационных системах, компьютерных играх, банковских терминалах, мобильных и многих других устройствах. RealSpeak Solo поддерживает 22 языка и имеет более 30 голосов, что позволяет использовать эту систему по всему миру.

RealSpeak Solo занимает от 8 до 20Мб памяти на мобильных устройствах и до 50Мб на рабочих станциях. Это делает систему идеально подходящей для широкого круга применений, где критически хорошее качество речи при ограниченном объеме памяти. Благодаря высокому качеству синтезированного голоса система может быть использована вместе с частями предварительно записанного голоса или полностью заменять предварительные записи.

    1. Тестирование системы

Данная TTSсистема используетMicrosoftSpeechAPI и может быть протестирована сразу после установки с помощью аплета “Речь” из панели управленияWindows2000/XP.

SpeechAPI - это программный интерфейс, позволяющий пользовательской программе обращаться к установленным в системе голосовым движкам, поддерживающим этот интерфейс.

Но чтобы использовать систему для чтения текста из файлов необходимо установить дополнительное ПО. Часто для этого используются программы для чтения электронных книг. При тестировании использовалась программа Cool Reader 2 [ http://coolreader.org/ ].

На сегодняшний день Realspeak Solo Katerina одна из лучших TTSдля русского языка и качество произношения отличное, но иногда бывают неправильные ударения и интонации. Такое случается, например, когда слово произносится не по стандартным правилам и системе сложно определить, куда поставить ударение и как произнести слово. В таких случаях помогают словари произношения.

Словари используются программами чтения (в нашем случае Cool Reader 2) и никакого отношения к настройкам самой TTSне имеют. Программа чтения просто подменяет дляTTSнаписание слов, которые произносятся не правильно (см. скриншот).

При использовании словарей, качество произношения становится такое, что длительное прослушивание синтезированного текста не вызывает неудобств и многие программа чтения (в том числе и Cool Reader 2) имеют функцию преобразования книг в mp3, для дальнейшего прослушивания книги, например на плеере.

Использованная литература:

  1. Синтез и распознавание речи. Современные решения. Александр Фролов, Григорий Фролов, 2003. http://www.frolov-lib.ru/books/hi/index.html

  2. Речевой портал "ЧАРА.РУ" http://4ara.ru/

  3. http://ru.wikipedia.org/wiki/Синтез_речи

11