Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие _ 30.01.12 _ правил Журавлев.doc
Скачиваний:
60
Добавлен:
03.04.2015
Размер:
2.97 Mб
Скачать

5 Раздел. Системы машинного перевода

Машинный перевод (МП), или автоматический перевод (АП), — интенсивно развивающаяся область научных исследо­ваний, экспериментальных разработок и уже функционирующих систем (СМП), в которых к процессу перевода с одного естествен­ного языка (ЕЯ) на другой привлекается ЭВМ. СМП открывают быстрый и систематический доступ к информации на иностранном языке, обеспечивают оперативность и единообразие в переводе больших потоков текстов, в основном научно-техниче­ских. Работающие в промышленном масштабе СМП опираются на большие терминологические банки данных и, как правило, требуют привлечения человека в качестве пред-, интер- или постредактора. Современные СМП, в особенности те, которые опираются при переводе на базы знаний в определенной предметной области, относят к классу систем искусственного интеллекта (ИИ).

Основные сферы использования систем МП:

1. В отраслевых службах информации при наличии большого массива или постоянного потока иноязычных источников. Если СМП используются для выдачи сигнальной информации, постредактирование не требуется.

2. В крупных международных организациях, имеющих дело с многоязычным политематическим массивом документов. Таковы условия работы в Комиссии Европейских сообществ в Брюсселе, где вся документация должна появляться одновременно на девяти рабочих языках. Поскольку требования к переводу здесь высоки, МП нуждается в постредактировании.

3. В службах, осуществляющих перевод технической до­кументации, сопровождающей экспортируемую продукцию. Пе­реводчики не справляются в требуемые сроки с обширной документацией (так, спецификации к самолетам и другим сложнымобъектам могут занимать до 100 000 и более страниц). Структураи язык технической документации достаточно стандартны, что облегчает МП и даже делает его предпочтительным относительно ручного перевода, т. к. гарантирует единый стиль всего массива. Поскольку перевод спецификаций должен быть полным и точным, продукция МП нуждается в постредактировании.

4. Для синхронного или почти синхронного перевода и некоторого постоянного потока однотипных сообщений. Таков поток метеосводок в Канаде, который должен появляться одновременно на английском и французском языках.

Помимо практической потребности делового мира в СМП существуют и чисто научные стимулы к их развитию: стабиль­но работающие экспериментальные системы МП являются опытным полем для проверки различных аспектов общей теории понимания, речевого общения, преобразования информации, а также для создания новых, более эффективных моделей самого МП.

5.1. Классификация смп

Классификация СМП может учитывать также технологические характеристики: масштабность, степень реализованности, долю участия человека в процессе МП. С точки зрения соотноше­ния машина — человек можно говорить о полностью автоматическом переводе и о человеко-машинном переводе (ЧМП). Системы, осуществляющие полностью автоматический перевод, — это СМП большого масштаба, реализованные на больших ЭВМ. Они выполняют перевод без участия человека, что не исключает ни некоторой предварительной обработки текста, ни постредактирования (как это делается и в случае обычного перевода). Но за сам процесс перевода — от ввода исходного до получения конечного текста — «ответственна» СМП, располагающая словарями, грамматикой и программами. Системы типа ЧМП выполняют перевод в интерактивном режиме, обычно на малых — мини- или микро- (персональных) ЭВМ (иногда соединенных с основной центральной ЭВМ). Выделяют две группы таких систем: типа НАМТ (англ. human-aided machine translation) — МП с участием че­ловека — и типа МАНТ (англ.machine-aidedhumantranslation) — человеческий перевод с участием ЭВМ. В системах первой группы перевод выполняет СМП, обращаясь к человеку за решением сложных случаев (снятие неоднозначности, выбор одного вариан­та из нескольких и т. п.). В системах второй группы за выпол­нение перевода отвечает человек, который работает за дисплеемв интерактивном режиме и может обращаться к ЭВМ, например, для поиска слов в машинных словарях и конкордансах, а также в удаленных банках терминов. Предредактирование при этом, как правило, не нужно, а постредактирование осуществляется, как при обычном переводе.

По количеству привлекаемых языковых пар СМП делятся на двуязычные (реализующие функцию перевода только для данной языковой пары) и многоязычные. Те и другие, в зависимости от техники лингвистического анализа, могут быть либо бинарны­ми (если анализ входного языка ведется в категориях выходного), либо универсальными (если устройство анализа не зависит от выходного языка). Универсальная двуязычная СМП может легкостать многоязычной при комбинации с компонентами анализа и/или синтеза других универсальных систем.

В 80-е годы в отдельный класс выделяют СМП, основанные на знаниях (knowledge-basedsystems). В системах этого класса (представляющего собой подкласс систем ИИ) в качестве отдельного компонента включаются экстралингвистические знания (знания о ПО), хотя они могут иметь те же формы представления, что и собственно лингвистическая информация (т. е. записываться в словарях и грамматиках). Отчетливо к этому классу принадлежат те СМП, которые используют при анализе концептуальную сеть знаний.