- •Isbn 978-5-9765-0098-3 (Флинта) isbn 978-5-02-034597-3 (Наука)
- •1.1.2. Методы воспроизведения и обработки данных
- •1.1.3. Понятие информации
- •1.1.4. Понятие контекстного метода
- •1.2. Данные
- •1.2.2. Операции
- •1.3.2. Классификация прикладных программ
- •1.3.3. Периферийные устройства
- •1.4. Интеллектуальные информационные системы
- •1.4.1. Искусственный интеллект (Artificial Intelligence)
- •1.4.2. Нейронные сети
- •1.4.3. Экспертные системы
- •2. Обзор лингвистических программ
- •2.1.1. Текстовые процессоры
- •2.1.3. Генераторы текстов и «говорящие» программы
- •2.2. Машинный перевод
- •2.2.1. Основные этапы развития машинного перевода
- •2.2.2. Как переводит компьютер
- •2.2.3. Классификация систем
- •2.3. Компьютерная лингвистика: нестандартные применения
- •2.3.1. Определение языка сообщения
- •2.3.2. Взлом шифров
- •2.3.3. Установление авторства
- •2.3.4. Построение роботов-поисковиков и снифферов
- •Заключение
- •Приложение
- •Оглавление
- •1 . Информация. Информационные
- •1.1. Информация 3
- •Информационный обмен, сигналы, данные 3
2.2.3. Классификация систем
1. Системы машинного перевода (МП)
Системы машинного перевода — программы, осуществляющие полностью автоматизированный перевод. Главным
58
критерием программы является качество перевода. Кроме этого, для пользователя важным является удобство интерфейса, легкость интеграции программы с другими средствами обработки документов, выбор тематики, утилита, пополнения словаря. С появлением Интернета основные поставщики систем МП включили в свои продукты web-интерфейсы, обеспечив при этом их интеграцию с остальным программным обеспечением и электронной почтой, что позволило применять механизмы МП для перевода web-страниц, электронных писем и онлайновых разговорных сеансов.
2. Системы с функцией Translation Memory (TM)
Системы с функцией Translation Memory (TM) предоставляют средства для так называемого Machine-assisted human translation (МАНТ) — перевода, выполняемого человеком с помощью машины.
Они основаны на технологии Translation Memory (TM) в противоположность МП, машинному переводу. Идея заключается в хранении базы данных переводов, сделанных профессиональным переводчиком, для того чтобы в процессе перевода предлагать человеку уже готовый перевод фразы или куска текста, если он уже был однажды переведен. Причем совпадение фразы не обязательно должно быть буквальным, а может определяться критериями «похожести», заложенными в программу, с возможностью их настройки пользователем. ТМ-программы очень полезны в ситуациях, в которых необходимо сделать перевод обновленной версии документа, переведенного ранее. Такая необходимость возникает при поддержке мультиязычных сайтов. Программа быстро обнаружит в документе места, подвергшиеся изменениям со времени предыдущей версии документа, и человеку останется перевести только эти изменившиеся части. ТМ-программы значительно повышают эффективность работы переводчика, избавляя его от рутинной, повторяющейся работы. Во многих фирмах, занимающихся переводом, владение одной из таких программ является существенным критерием при приеме на работу.
Контролируемый язык и машинный перевод на основе базы знаний
В системах на основе контролируемого языка реализован переход от свободного входного языка к контролируемому входному языку. Контроль входного языка предусматривает определенные ограничения лексики, грамматики, семантики. Контролируемый входной язык используется для упрощения выражений исходного текста, чтобы повысить качество перевода.
■-
Службы онлайнового перевода выполняют перевод прямо в окне броузера, не требуя установки программы на компьютер пользователя. Достаточно большое количество ссылок на бесплатные сервисы машинного перевода с указаниями направлений переводов приведено по адресу http://rivendel. com/~ric/resources/free. html.
Как правило, существует ограничение на объем вводимого текста.
Бесплатный онлайновый перевод можно сделать также по адресам:
—- http://www.t-mail.com/;
— http://www.freetranslation.com/.
5. Словари on-line
Наиболее полный список словарей представлен по адресу http://members.aol.com/Mgierhake/trans.html. В словарях on-line существует возможность поиска, есть строка ввода и меню для выбора входного и выходного языка. Среди словарей данного вида известны LOGOS ONLINE DICTIONARY (английский, французский, немецкий, испанский, итальянский, чешский), TRADOS MultiTerm, Langenscheidt's New College Dictionary on-line и т.д.
6. Услуги по переводу в Интернете
Практически каждая компания — производитель систем МП предлагает услуги по переводу. Например, на странице
60
Languge Partners International (http://www.languagepartners. com/reg-forms/inq-trans.html) организована служба переводов, которая обрабатывает любой электронный документ с помощью систем МП и отправляет обратно без редактирования. Пользователь может предоставить термины для пополнения словаря по своей тематике (за дополнительную плату) или сам его создать. Скорость перевода — 1 рабочий день. Стоимость — 0,04 доллара за слово (приблизительно 8 долларов за страницу). За дополнительную плату предоставляются услуги по сканированию. Направления перевода: английский—французский—английский, английский—немецкий—английский, английский—итальянский—английский, английский—испанский—английский, английский- португальский —английский, английский—японский—английский, английский—русский—английский. Однако чаще всего пользователю предоставляется возможность выбора: получить только машинный перевод, либо машинный перевод с последующим редактированием профессиональным переводчиком, либо перевод, выполненный профессиональным переводчиком. Такого рода сервис можно встретить по адресу http://www.plustranslation.com/ (сервис компании Transparent Language). Цена варьируется от 0,01 доллара за слово при машинном переводе до 0,38 при переводе с участием переводчика. Подобные услуги есть у SYSTRAN, L&H, Langscheidt, Language Engineering Corporation.
2.2.4. Инновационные технологии компании ПРОМТ
Ведущие сотрудники компании ПРОМТ начали заниматься исследованиями в области прикладной лингвистики и изучать модели построения систем машинного перевода более 20 лет назад, в конце 1970-х годов. Исследования велись в лаборатории инженерной лингвистики ЛГПИ им. А.И. Герцена (ныне педагогический университет). Накопленный теоретический багаж лег в основу технологий МП, разрабатываемых в компании ПРОМТ.
61
За 10 лет с момента основания компании ПРОМТ удалось создать передовые технологии МП, в основе которых заложены современные лингвистические алгоритмы, разработки в области математического моделирования и нейронных сетей. На базе этих технологий были разработаны системы машинного перевода, которые по качеству на 30% превосходят ведущие мировые аналоги.
В 2000 г. компания ПРОМТ выпустила семейство систем МП на основе нового ядра перевода. В новом ядре реализованы технологии расширенных сетей переходов и формализма нейронных сетей, что вывело машинный перевод на качественно новый уровень, а также последние разработки в области алгоритмов семантического анализа и синтаксического разбора.
Новым шагом в развитии МП компании ПРОМТ стало использование технологии F2F, обеспечивающей сохранение всей форматной информации в процессе перевода, что позволило осуществлять перевод сложноформатированных документов без потери форматных признаков.
Помимо развития собственно технологии машинного перевода, были приложены специальные усилия к тому, чтобы реализовать в новых системах возможность лингвистической настройки, которая обеспечивает значительное улучшение качества перевода для специализированных текстов.
В частности, появление поддержки тематик в новом ядре позволило кардинально изменить подход к переводу специализированных текстов. Использование тематик решило проблему лингвистической настройки системы на специализированные тексты и обеспечило эффективность их сохранения.
Легкость и удобство лингвистического администрирования систем МП было реализовано на базе следующих технологий:
AutoDetect для реализации автоматического определения темы документа;
SmartFolders для предварительного задания тематики пере вода всем документам, находящимся в определенной папке;
KeyWords — выбор тематики на основе предварительного за данного списка ключевых слов;
62
• SmartURL — возможность предварительного задания тематики перевода для конкретного URL.
Компания ПРОМТ предлагает онлайновые сервисы перевода текста, web-страниц и электронных писем для английского, немецкого, французского, испанского, итальянского и русского языков. Для перевода специализированных текстов можно подключать тематические словари.
Перевод текста. Позволяет переводить любые тексты, набранные в окне перевода или скопированные из буфера обмена (Clipboard).
Перевод web-страниц. Позволяет полностью переводить web-страницы, включая гиперссылки, с сохранением исходного форматирования.
Перевод электронной почты. Позволяет переводить и отправлять электронные письма непосредственно в онлайне.
WAP-переводчик. Новый сервис перевода для пользователей мобильных телефонов.