- •Вопрос 1.
- •Вопрос 2.
- •Вопрос 3.
- •Вопрос 4.
- •Вопрос 5.
- •Вопрос 6.
- •Вопрос 7.
- •Вопрос 8.
- •Вопрос 9.
- •Вопрос 10.
- •Вопрос 11.
- •Вопрос 12.
- •Вопрос 13.
- •Вопрос 14.
- •Вопрос 15.
- •Вопрос 16.
- •Вопрос 17.
- •Вопрос 18.
- •Вопрос 19.
- •Вопрос 20.
- •Вопрос 21.
- •Вопрос 22.
- •Вопрос 23.
- •Вопрос 24.
- •Вопрос 25.
- •Вопрос 26.
- •Вопрос 27.
- •Вопрос 28.
- •Вопрос 29.
- •Вопрос 30.
Вопрос 25.
Общая структура системы порождения письменного текста:
Оболочка: определяет назначение порождающей системы (диалог, сказка, стих и т.д.), содержит базу данных из 2 частей:
Нелингвистическая (понятия, связи, отношения между понятиями конкретной предметной области);
Лингвистическая (формализованные сведения о конкретном языке):
Списки морфем;
Слова с лексикой;
Синтаксические структуры предложения;
Семантико-синтаксические структуры абзацев и всего текста;
Планировщик выполняет функции:
Определяет ту информацию, которая должна быть в тексте;
Определяет, как она будет представлена;
Определяет порядок следования абзацев;
Устанавливает порядок следования синтаксических составляющих в пределах текста;
Осуществляет языковое оформление взаимосвязи предложений в тексте;
Осуществляет построение синтаксических структур предложений текста;
Осуществляет выбор соответствующей лексики.
Лингвистический реализатор обеспечивает грамматическую правильность текста и принимает все окончательные грамматические и морфологические решения.
Вопрос 26.
Системы распознавания речи
Данной проблемой учёные занимаются около 70 лет, первая промышленная система была создана в Японии второй половине 80-х, её называли системой надиктовки текста в ПК (диктографами), данная система имела узкую специализацию.
Под распознавание речи ПК понимают такое распознавание, которое подробно восприятию речи человеком, в любых условиях и при общении с любым человеком.
Решению проблемы мешает:
Отсутствие чётких теоретических представления, которые описывали бы весь комплекс преобразований, осуществляемых нервной системой при переработке речевых сигналов;
Обладание слитно произнесённой речью:
Размытой границы слов:
Влияния соседних звуков друг на друга;
Нечётким выговором и даже исчезновением функциональных слов;
Наличие в голосе говорящего экстралингвистической информации, указывающей на пол, возраст и т.д.;
Большое значение в процессе речевого общения паралингвистических средств коммуникации:
Кинесика (мимика, жесты);
Фанация (характеристика голоса);
Проксемика (расстояние между людьми).
Поэтому сегодня АРР может осуществляться только при определённых ограничениях:
Распознавание изолированно произнесённых слов;
Распознавание речи с настройкой на голос пользователя;
Распознавание с опорой на небольшой, заранее определённый словарь.
IBM – лидер в продуктах такого рода с системой ViaVoice (140 слов в минуту). Популярной системой надиктовки является DragonSystem.
Алгоритм распознавания:
Ввод устной речи, обработка данных (убор шумов);
Деление звукового потока на сегменты;
Выделение в каждом сегменте минимальной акустической единицы – слова;
Сравнение выделенных единиц с эталонами.
Промышленные системы распознавания речи условно делятся на 4 группы:
Средства речевого управления (ПК, телефон);
Средства надиктовки текста;
Информационно-справочные системы в диалоговом режиме в качестве автоответчика;
Средства идентификации человека по образцу речи.