Вопрос 25.

Общая структура системы порождения письменного текста:

Оболочка: определяет назначение порождающей системы (диалог, сказка, стих и т.д.), содержит базу данных из 2 частей:

Нелингвистическая (понятия, связи, отношения между понятиями конкретной предметной области);
Лингвистическая (формализованные сведения о конкретном языке):

Списки морфем;
Слова с лексикой;
Синтаксические структуры предложения;
Семантико-синтаксические структуры абзацев и всего текста;

Планировщик выполняет функции:

Определяет ту информацию, которая должна быть в тексте;
Определяет, как она будет представлена;
Определяет порядок следования абзацев;
Устанавливает порядок следования синтаксических составляющих в пределах текста;
Осуществляет языковое оформление взаимосвязи предложений в тексте;
Осуществляет построение синтаксических структур предложений текста;
Осуществляет выбор соответствующей лексики.

Лингвистический реализатор обеспечивает грамматическую правильность текста и принимает все окончательные грамматические и морфологические решения.

Вопрос 26.

Системы распознавания речи

Данной проблемой учёные занимаются около 70 лет, первая промышленная система была создана в Японии второй половине 80-х, её называли системой надиктовки текста в ПК (диктографами), данная система имела узкую специализацию.

Под распознавание речи ПК понимают такое распознавание, которое подробно восприятию речи человеком, в любых условиях и при общении с любым человеком.

Решению проблемы мешает:

Отсутствие чётких теоретических представления, которые описывали бы весь комплекс преобразований, осуществляемых нервной системой при переработке речевых сигналов;
Обладание слитно произнесённой речью:
Размытой границы слов:
Влияния соседних звуков друг на друга;
Нечётким выговором и даже исчезновением функциональных слов;
Наличие в голосе говорящего экстралингвистической информации, указывающей на пол, возраст и т.д.;
Большое значение в процессе речевого общения паралингвистических средств коммуникации:
1. Кинесика (мимика, жесты);
2. Фанация (характеристика голоса);
3. Проксемика (расстояние между людьми).

Поэтому сегодня АРР может осуществляться только при определённых ограничениях:

Распознавание изолированно произнесённых слов;
Распознавание речи с настройкой на голос пользователя;
Распознавание с опорой на небольшой, заранее определённый словарь.

IBM – лидер в продуктах такого рода с системой ViaVoice (140 слов в минуту). Популярной системой надиктовки является DragonSystem.

Алгоритм распознавания:

Ввод устной речи, обработка данных (убор шумов);
Деление звукового потока на сегменты;
Выделение в каждом сегменте минимальной акустической единицы – слова;
Сравнение выделенных единиц с эталонами.

Промышленные системы распознавания речи условно делятся на 4 группы:

Средства речевого управления (ПК, телефон);
Средства надиктовки текста;
Информационно-справочные системы в диалоговом режиме в качестве автоответчика;
Средства идентификации человека по образцу речи.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 / 2017 18 19 20 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.09.201971.68 Кб6Код-ние текс, звук, граф-ИНСТ.doc
#
08.06.20151.13 Mб5Кодекс об административных правонарушениях.doc
#
08.11.2019162.3 Кб4Кодировки СМП.doc
#
08.06.2015916.2 Кб2956Комиссаров В. Н. Современное переводоведение.pdf
#
08.06.201590.13 Кб11коммуникации вопрос 41.docx
#
08.06.2015169.63 Кб9Конспект по ИТ.docx
#
08.06.2015100.48 Кб18КОНТР. РАБ. 9 ПО ГРАММАТИКЕ 4 семестр.pdf
#
08.06.2015124.42 Кб36Концепция Иностранный язык.doc
#
17.04.2019163.84 Кб4Копия 3 курс 2 семестр.doc
#
17.04.2019185.34 Кб9Копия 4 курс 1 семестр.doc
#
27.09.201945.97 Кб4КП.1-4.docx