- •Интеллектуальные
- •Предисловие
- •1. Раздел. Экспертные системы
- •1.1. Назначение и принципы построения экспертных систем
- •1.2. Классификация экспертных систем
- •1.3. Методология разработки экспертных систем
- •1.4. Этапы разработки экспертных систем
- •1.5. Приобретение знаний для экспертных систем
- •1.6. Представление знаний и выводы в экспертных системах
- •1.7. Особенности различных представлений знаний
- •2. Раздел. Системы общения на естественном языке
- •2.1. Назначение и область применения естественно-языковых систем
- •2.2. Обобщенная схема естественно-языковой системы
- •Основные параметры ея-системы
- •2.3. Настройка естественно-языковых систем
- •2.4. Классификация естественно-языковых систем
- •Задачи, решаемые основными компонентами системы
- •Основные сведения о ея-системах
- •3. Раздел. Системы переработки визуальной информации
- •3.1. Назначение, классификация и области применения
- •3.2. Автоматизированные системы обработки изображений
- •3.3. Системы анализа изображений
- •3.4. Системы машинной графики
- •Характеристики автоматизированных систем обработки изображений
- •4. Раздел. Системы речевого общения
- •4.1. Основные положения
- •4.2.Классификация речевых процессоров
- •4.2.1. Анализаторы
- •4.2.2. Синтезаторы речи
- •4.3. Обзор промышленных систем речевого общения
- •Устройства синтеза речи
- •Устройства распознавания речи
- •4.4. Перспективные зарубежные системы речевого общения
- •4.5. Тенденции применения средств речевого общения
- •5 Раздел. Системы машинного перевода
- •5.1. Классификация смп
- •5.2. Лингвистическое обеспечение смп
- •5.2.1. Словари
- •5.2.2. Грамматики и алгоритмы
- •5.3. Математическое и программное обеспечение смп
- •5.4. Оценка смп
- •Основные системы мп и их характеристики
- •Список использованной и рекомендуемой литературы
- •Содержание
5 Раздел. Системы машинного перевода
Машинный перевод (МП), или автоматический перевод (АП), — интенсивно развивающаяся область научных исследований, экспериментальных разработок и уже функционирующих систем (СМП), в которых к процессу перевода с одного естественного языка (ЕЯ) на другой привлекается ЭВМ. СМП открывают быстрый и систематический доступ к информации на иностранном языке, обеспечивают оперативность и единообразие в переводе больших потоков текстов, в основном научно-технических. Работающие в промышленном масштабе СМП опираются на большие терминологические банки данных и, как правило, требуют привлечения человека в качестве пред-, интер- или постредактора. Современные СМП, в особенности те, которые опираются при переводе на базы знаний в определенной предметной области, относят к классу систем искусственного интеллекта (ИИ).
Основные сферы использования систем МП:
1. В отраслевых службах информации при наличии большого массива или постоянного потока иноязычных источников. Если СМП используются для выдачи сигнальной информации, постредактирование не требуется.
2. В крупных международных организациях, имеющих дело с многоязычным политематическим массивом документов. Таковы условия работы в Комиссии Европейских сообществ в Брюсселе, где вся документация должна появляться одновременно на девяти рабочих языках. Поскольку требования к переводу здесь высоки, МП нуждается в постредактировании.
3. В службах, осуществляющих перевод технической документации, сопровождающей экспортируемую продукцию. Переводчики не справляются в требуемые сроки с обширной документацией (так, спецификации к самолетам и другим сложнымобъектам могут занимать до 100 000 и более страниц). Структураи язык технической документации достаточно стандартны, что облегчает МП и даже делает его предпочтительным относительно ручного перевода, т. к. гарантирует единый стиль всего массива. Поскольку перевод спецификаций должен быть полным и точным, продукция МП нуждается в постредактировании.
4. Для синхронного или почти синхронного перевода и некоторого постоянного потока однотипных сообщений. Таков поток метеосводок в Канаде, который должен появляться одновременно на английском и французском языках.
Помимо практической потребности делового мира в СМП существуют и чисто научные стимулы к их развитию: стабильно работающие экспериментальные системы МП являются опытным полем для проверки различных аспектов общей теории понимания, речевого общения, преобразования информации, а также для создания новых, более эффективных моделей самого МП.
5.1. Классификация смп
Классификация СМП может учитывать также технологические характеристики: масштабность, степень реализованности, долю участия человека в процессе МП. С точки зрения соотношения машина — человек можно говорить о полностью автоматическом переводе и о человеко-машинном переводе (ЧМП). Системы, осуществляющие полностью автоматический перевод, — это СМП большого масштаба, реализованные на больших ЭВМ. Они выполняют перевод без участия человека, что не исключает ни некоторой предварительной обработки текста, ни постредактирования (как это делается и в случае обычного перевода). Но за сам процесс перевода — от ввода исходного до получения конечного текста — «ответственна» СМП, располагающая словарями, грамматикой и программами. Системы типа ЧМП выполняют перевод в интерактивном режиме, обычно на малых — мини- или микро- (персональных) ЭВМ (иногда соединенных с основной центральной ЭВМ). Выделяют две группы таких систем: типа НАМТ (англ. human-aided machine translation) — МП с участием человека — и типа МАНТ (англ.machine-aidedhumantranslation) — человеческий перевод с участием ЭВМ. В системах первой группы перевод выполняет СМП, обращаясь к человеку за решением сложных случаев (снятие неоднозначности, выбор одного варианта из нескольких и т. п.). В системах второй группы за выполнение перевода отвечает человек, который работает за дисплеемв интерактивном режиме и может обращаться к ЭВМ, например, для поиска слов в машинных словарях и конкордансах, а также в удаленных банках терминов. Предредактирование при этом, как правило, не нужно, а постредактирование осуществляется, как при обычном переводе.
По количеству привлекаемых языковых пар СМП делятся на двуязычные (реализующие функцию перевода только для данной языковой пары) и многоязычные. Те и другие, в зависимости от техники лингвистического анализа, могут быть либо бинарными (если анализ входного языка ведется в категориях выходного), либо универсальными (если устройство анализа не зависит от выходного языка). Универсальная двуязычная СМП может легкостать многоязычной при комбинации с компонентами анализа и/или синтеза других универсальных систем.
В 80-е годы в отдельный класс выделяют СМП, основанные на знаниях (knowledge-basedsystems). В системах этого класса (представляющего собой подкласс систем ИИ) в качестве отдельного компонента включаются экстралингвистические знания (знания о ПО), хотя они могут иметь те же формы представления, что и собственно лингвистическая информация (т. е. записываться в словарях и грамматиках). Отчетливо к этому классу принадлежат те СМП, которые используют при анализе концептуальную сеть знаний.