Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Uchebnoe_posobie_Litvinovoy_E_M_Mashinnyy_perev...doc
Скачиваний:
59
Добавлен:
19.09.2019
Размер:
402.43 Кб
Скачать
  1. Описание ошибок в машинном переводе

Применение машинного перевода без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных бродящих по Интернету шуток.

Зачастую программы машинного перевода понимаются как какое-то уникальное средство, которое способно вытеснить живых, мыслящих переводчиков. Некоторые пользователи полагают, что, если с помощью компьютера сегодня можно добыть любые сведения из многочисленных информационных источников, от него можно ожидать соответствующей компетентности также в вопросах качественной трансформации этих сведений в любой возможный языковой формат.

Однако ни для кого не секрет, что такое преставление крайне ошибочное. Знающие специалисты, равно как и производители подобных программ, понимают, что в действительности ситуация выглядит иначе. Конечно, рекламируя свои программные продукты, производители честно признаются, что качество машинного перевода далеко от идеального и что получение адекватного перевода возможно только при вмешательстве человека, однако не всегда раскрывается тот факт, что человек, которому предстоит обработать такой перевод, должен быть квалифицированным переводчиком и ему придется потратить массу времени на придание машинному тексту качества, достойного профессионального перевода.

И как бы ни пытались производители приукрасить достоинства своей продукции, пользователи многочисленных онлайн-переводчиков всегда имеют возможность убедиться в том, что виртуальные «толмачи» не всегда способны достойно справляться с поставленными перед ними задачами. Доказательством этому служат многочисленные шутки, переходящие с сайта на сайт и высмеивающие недостаточную компетентность онлайн-переводчиков в вопросах качественного перевода. К числу любимых развлечений скептически настроенных пользователей онлайн-переводчиков относится перевод коротких предложений или текстов песен в различных направлениях и сравнение полученного результата с исходным вариантом. К избитым примерам относится перевод предложения "Мама мыла раму" на английский язык, который звучит как “Mum washed the frame”. Если затем снова перевести полученное предложение на русский язык, то разные переводчики выдают свои результаты: "мама вымыла структуру" (перевод Translate.ru – компания PROMT) или "мама помыла рамку" (вариант Babelfish.yahoo.com). Всем известен также пример с переводом предложения “My cat has given birth to four kittens, two yellow, one white and one black”, выполненным онлайн-переводчиком компании PROMT, которое в русскоязычном исполнении звучит как «Моя кошка родила четырех котят, два желтых цвета, одно белое и одного афроамериканца». Нужно отметить, что разработчики поработали над усовершенствованием своего продукта, так как раньше данное предложение начиналось с абсурдного «Мой кот родил…», однако радует, что данный переводчик компетентен в вопросе политкорректности. К числу подобных примеров относятся также переводы различных песен и литературных произведений, доставляющие немало веселья экспериментаторам.

Сотрудники многих фирм на каждом шагу встречаются с многочисленными примерами абсурдных переводов, выполненных посредством онлайн-переводчиков. Зарубежные клиенты, желающие сделать запрос на перевод, или коллеги, предлагающие свое сотрудничество в сфере переводов, часто прибегают к помощи онлайн-переводчиков, столкнувшись с необходимостью перевода электронных сообщений на русский язык.

Например, однажды сотрудники одной из фирм получили электронное сообщение следующего содержания: Привет Уважаемые! Пожалуйста, как вы! Надеюсь, ты штраф и в отличном состоянии health. I пошел через ваш профиль сегодня на www.multitran.ru и я прочитал его и принял в ней интереса, пожалуйста, если вы не возражаете, я хотел, чтобы вы напишите мне по этому ID (***@yahoo.com) надеются услышать от вас в ближайшее время, и я буду Жду ваших почту, потому что я что-то очень важно, чтобы рассказать вам. Много любви Грейс.

Автор сообщения сопроводил данное обращение исходным текстом на английском языке:

Hi Dear! Please how are you! hope you are fine and in perfect condition of health. I went through your profile today at www.multitran.ru and i read it and took interest in it, please if you don't mind i will like you to write me on this ID (***@yahoo.com ) hope to hear from you soon, and I will be waiting for your mail because i have something VERY important to tell you. Lots of love Grace.

Не нужно долго гадать, чтобы понять, что сообщение на русском языке является результатом работы онлайн-переводчика. Кстати, путем несложного эксперимента было установлено, что автором данного перевода был онлайн-переводчик Google. Это сообщение является ярким подтверждением тому, что данный онлайн-переводчик не особо преуспел в своем деле и вряд ли может бросить достойный вызов профессиональному переводчику. Не вдаваясь в глубокий анализ, можно отметить, что основным недостатком онлайн-переводчика является незнание грамматических правил (в основном это касается согласования частей речи и членов предложений), а также неумение распознавать и корректно переводить некоторые лексические единицы, употребленные в рамках заданного контекста, и устойчивые выражения, в результате чего, вместо «надеюсь, у Вас все хорошо», переводчик выдал нелепое и искажающее смысл предложения выражение «надеюсь, ты штраф» (слово «fine» было употреблено в значении «штраф»). Истинная причина получения таких низкосортных переводов кроется в том, что программы машинного перевода не способны учитывать экстралингвистические факторы. Именно поэтому многие переводчики дословно переводят те или иные термины и, кроме того, не всегда отличают имена собственные от знаменательных слов.

Ярким примером этому может послужить перевод статьи, посвященной Лоре Буш, супруге бывшего президента Америки, выполненный с помощью программы-переводчика. Ее полное имя зазвучало на французском языке как «le buisson de Laura», то есть «кустарник Лоры». Программа не распознала фамилию «Bush» как имя собственное и дословно перевела ее на французский как «кустарник». Но вся нелепость этой ситуации заключается в том, что на французском сленге слово "buisson" имеет сексуальную коннотацию.

Данные примеры свидетельствуют о том, что научить самый современный компьютер языковой логике значительно сложнее, чем математическим алгоритмам и логике статистического анализа. Чтобы создать в той или иной степени связный машинный текст, программа может лишь использовать ограниченный набор определенных лингвистических алгоритмов, заложенных в ее базу. Сначала система подвергает анализу структурные элементы исходного предложения, затем изменяет его в соответствии правилами языка и выдает конечный вариант. Однако как бы ни пытались производители программ машинного перевода усовершенствовать свои разработки, еще ни одна технология не выдерживала сравнения с теми алгоритмами перевода и многочисленными трансформациями, которым учат живых переводчиков в школах и вузах. Безусловно, для получения связного текста программу можно снабдить богатой словарной базой, включающей устойчивые выражения, а также подключить специализированные словари, чтобы переводчик смог перевести тематические тексты. Но, как показывает реальный опыт работы с онлайн-переводчиками, это лишь малая часть того, что необходимо для обеспечения приемлемого качества. Основной проблемой таких переводчиков, равно как и других систем машинного перевода, является отсутствие фоновых знаний. Компьютер знает только языковые соответствия, а ведь переводчику очень часто приходится выходить за рамки формального текста и обращаться не к языковым знаниям, а к экстралингвистическим факторам, включающим знания о реальном мире, культуре, истории, технике. Профессиональные переводчики, особенно технические, – это очень образованные люди, и все их знания непосредственно задействованы в процессе перевода. Только в таком случае может быть гарантировано действительно первоклассное качество переводов. Поэтому если разработчики сервисов онлайн-перевода стремятся к предоставлению адекватных, качественных переводов, они должны снабдить своих машинных переводчиков такими же фоновыми знаниями и, главное, научить их правильно обращаться с заложенным багажом знаний. Проще говоря, программа должна понять, что возникла какая-то проблема, для решения которой необходимо прибегнуть к дополнительным знаниям, и правильно сформулировать запрос к имеющейся базе. Показательным примером служит перевод на западноевропейские языки предложений, в которых упоминаются известные правители или их дети. В таких предложениях артикль, категория которого характерна для языков данной языковой семьи, должен ставиться в зависимости от общего количества детей. Например, при переводе выражения «сын царя Федора» артикль необходимо выбирать в зависимости от того, сколько сыновей было у царя Федора.

В качестве аналогичного примера можно привести перевод надписи на постаменте памятника, открытого во Франции в честь Анны Ярославны, дочери князя Киевского Ярослава Мудрого. Перевод надписи на французском языке звучал как "Anne de Kiev la reine de la France", и все бы ничего, если бы не лишний артикль. В случае с Францией "la France" звучит как "единая Франция", что не искажает смысл. Что же касается дочери князя, "la reine" означает, что она единственная за всю историю королева Франции. Переводчик, знакомый со всеми нюансами французской грамматики, не допустил бы такую нелепую ошибку, а вот для электронного переводчика – это довольно типичная ошибка.

Чаще всего подобные шутки связаны с тем, что программа не распознаёт контекст фразы и переводит термины дословно, к тому же не отличая собственных имён от обычных слов. Тот же переводчик ПРОМТ превращает «bra-ket notation» в «примечание Кети лифчика», «Lie algebra» — в «алгебру Лжи», «eccentricity vector» — в «вектор оригинальности», «Shawnee Smith» в «индеец племени шони Смит» и т. п. Переводчик Google, наоборот, слово «rice» часто принимал за фамилию госсекретаря США.

А теперь рассмотрим примеры машинного перевода отрывков из художественных и научных текстов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]