Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Uchebnoe_posobie_Litvinovoy_E_M_Mashinnyy_perev...doc
Скачиваний:
59
Добавлен:
19.09.2019
Размер:
402.43 Кб
Скачать
  1. История развития машинного перевода

Машинный перевод (Machine Translation, MT) – это технология связного перевода текстов компьютерной программой с одного естественного языка на другой.

Впервые к решению данной проблемы с действительно научной точки зрения приступил Чарльз Бэббидж, который спроектировал в 1836–1848 гг. первую цифровую вычислительную машину, умевшую выполнять аналитические операции. Идея Бэббиджа заключалась в использовании памяти объемом в тысячу 50-разрядных десятичных чисел для хранения словарных баз. Эта идея была приведена как основание для запроса у правительства Англии финансовых средств, необходимых для реализации задуманного проекта и создания такой аналитической машины. К сожалению, проекту по созданию прототипа системы Бэббиджа так и не было суждено завершиться, да и вряд ли его воплощение принесло бы какие-то значимые результаты.

Рождение машинного перевода как самостоятельного научного направления приходится на март 1947 г., когда криптограф Уоррен Уивер, руководивший отделением естественных наук Рокфеллеровского фонда, обратился с письмом к Норберту Винеру, в котором высказал мысль о рассмотрении задачи перевода с одного языка на другой как новую область использования технологий декодирования. Уивер уверял, что перевести текст с одного иностранного языка на другой – не такая уж сложная задача. Стоит лишь представить, что исходный текст написан на родном языке, но закодирован с помощью специальных знаков, поэтому, чтобы понять смысл информации, заложенной в данный текст, достаточно взломать этот код. Сравнение технологии перевода и дешифрования казалось вполне естественным в условиях послевоенного времени, особенно с учетом блестящих успехов, которые были достигнуты в области криптографии во время второй мировой войны.

Это письмо вызвало большой резонанс, и в 1949 г., после многочисленных дискуссий, Уоррен Уивер опубликовал специальный меморандум, теоретически обосновывавший возможность реализации предложенной им идеи машинного перевода. Мысли, высказанные в этом меморандуме, вызвали очень активный интерес международных ученых и инженеров и легли в основу «концепции «interlingva», согласно которой процесс перевода делился на два этапа: 1) перевод исходного текста на промежуточный язык (в основе которого лежал упрощенный вариант английского языка), 2) оформление промежуточного перевода средствами конечного языка. В 1952 г. была проведена первая конференция, организатором которой стал известный математик Бар-Хиллел, посвященная вопросу о выработке различных способов семантического описания, синтаксических языковых правил, морфологических структур и структуры словарей, необходимых для систем автоматического перевода.

Большую роль в развитии машинного перевода также сыграл факт, что популярный в те времена «тест на разумность», который был предложен в 1950 г. Алан Тьюрингом, английским математиком, практически сменил вопрос «обладает ли машина способностью мыслить?» вопросом «способна ли машина общаться с человеком посредством естественного языка таким образом, чтобы человек не смог отличить ее от живого человека?». В центр исследований встал вопрос о компьютерной обработке языковых сообщений на естественном языке, а между программистами и лингвистами установилось невиданное доселе взаимопонимание. Органы государственной власти стали проявлять активный интерес к идее машинного перевода и начали выделять огромные суммы денежных средств на финансирование данного проекта.

Первый успех в сфере автоматизации переводов связан с "Джорджтаунским экспериментом", который был осуществлены 1954 г. на машине IBM-701. Программно-языковое обеспечение данного эксперимента было очень скромным: словарная база состояла лишь из 250 слов, а грамматика была представлена 6 синтаксическими правилами, вся же система могла перевести всего 49 предварительно отобранных предложений. Эксперимент положил начало настоящему исследовательскому буму, в течение следующего десятилетия правительство США потратило на исследования в области машинного перевода примерно 40 млн. долл. Следует отметить, что перевод выполнялся с русского языка на английский, что, возможно, в какой-то мере объясняет последующую резкую активизацию разработок в этой области также в СССР. К концу 1955 г. во многих академических центрах СССР были созданы и протестированы программы машинного перевода, в основу которых легла имевшаяся в то время вычислительная база (БЭСМ и "Стрела").

Первые успехи вызвали настоящую эйфорию среди специалистов. Сразу же после достижения положительных результатов было создано несколько глобальных проектов, направленных на решение проблемы машинного перевода для современных языков, а также большое количество мелких проектов для отдельных направлений. Особое внимание стало уделяться вопросам моделирования языка и языковых аспектов, языковой и мыслительной деятельности, изучению языковой формы. В 50-х гг. прошлого века во многих странах мира были созданы отделения машинного перевода и прикладной лингвистики.

Но, к сожалению, реализация идеи машинного перевода оказалось не таким уж легким делом, как казалось поначалу. Изучение данной проблемы за свою историю переживало триумфы и падения. В середине 60-х гг. был завершен первый этап исследований систем машинного перевода, и первоначальное воодушевление сменилось скептическим настроением, чему в значительной степени поспособствовала публикация доклада специального комитета по прикладной лингвистике (ALPAC) Национальной академии наук США, так называемая «черная книги машинного перевода». Авторы данного доклада утверждали, что системы автоматического перевода не смогут обеспечивать приемлемое качество переводов в будущем. В результате этого было прекращено финансирование подобных исследований и, соответственно, остановлены все начатые работы.

Но, несмотря на то, что машинный перевод был признан бесперспективным, данная проблема всегда вызывала высокий интерес, и лишь на заре 80-х гг. тема машинного перевода снова приобрела актуальность - наряду с изучением систем информационного поиска и искусственного интеллекта началось восстановление незаконченных разработок в области автоматизации переводов. В течение этого времени были выработаны способы морфологического анализа (автоматического) для основных языков Европы, сформулированы основные требования к семантическим элементам таких систем и разработаны методы автоматического анализа синтаксических структур. В условиях международного терминологического обмена были составлены крупные электронные словари, оснащенные богатым словарным запасом и терминологической базой по различным научно-техническим отраслям. За это время были созданы крупные международные проекты с солидными бюджетами, к числу которых относятся EU ROTRA (Европейское экономическое сообщество), METAL (США и Германия), ARIANE (Франция), KANT (США) и пр. Но, как и раньше, ни один из этих проектов не смог предложить уникальное решение, применимое в рамках массового использования.

Глобальные проекты были посвящены решению общих задач машинного перевода и ориентированы на разработку способов описания слов, входящих в терминологическую базу словаря, и, отдельно, на создание алгоритмов перевода. Наряду с этими разработками, проводились отдельные исследования, посвященные описанию, например, способов выражения прямого дополнения для глаголов говорения». К сожалению, все эти системы сопровождались скромным уточнением «прототип» или «экспериментальная», а реальную коммерческую систему так никто и не мог предложить. Объяснением всему был тот факт, что все разработанные методы описания перевода, при их переносе в естественную среду, противоречили с методами, применяемыми при составлении словарных статей. Локальные же проекты занимались решением узких задач. В рамках таких проектов словарное описание и описание алгоритмов трактовались как стороны одного вопроса, но поиск решения осуществлялся в ограничении грамматического или семантического аспекта. Это ограниченное количество грамматических алгоритмов можно было применить для описания определенной части предложений естественных языков, но на его основе невозможно было правильно анализировать и переводить реальные тексты. Несмотря на то, что эти подходы не привели к созданию практически применимых коммерческих систем, проведенные работы позволили понять всю сложность стоявшей перед разработчиками задачи и сузить сферу исследований в подобных проектах. Как это ни парадоксально, однако именно такие локальные проекты легли в основу систем машинного перевода, которые сегодня предлагаются пользователям. К их числу относятся системы Power Translator (производство Globalink), TRANSEND (компания Intergraph), а также Language Assistant (MicroTac).

Однако реальная сложность задач, с которыми столкнулись создатели систем машинного перевода, была выше, чем уровень развития имевшегося в то время аппаратно-программного обеспечения. Количество одних только грамматических и орфографических правил, необходимых для создания таких систем, доходило до десятков тысяч. Объемы памяти и скорость работы имевшихся в то время компьютеров не были в состоянии справиться с реальными массивами данных. В результате этого, «вторая волна» разработок и исследований в области систем машинного перевода тоже сошла на нет.

Зато 90-е годы, в течение которых индустрия информационных и коммуникационных технологий пережила бурный прогресс, стали эпохой возрождения машинного перевода: создание персональных компьютеров, внедрение Интернета и локальных сетей обусловили стремительный рост интереса к машинному переводу. Созданные программы машинного перевода стали перспективной сферой для капиталовложений для частных предпринимателей и государственных структур. В условиях такого расцвета совершенствование систем машинного перевода казалось более реальной задачей, а достигнутые результаты – пользующимися еще большим спросом.

На сегодняшнем рынке IT существует две технологии автоматизированного перевода информации: машинный перевод (Machine Translation, МТ) и Translation Memory (далее – TM). О технологии ТМ подробно говорится в разделе «Translation Memory»

(http://www.promt.ru/ru/technology/translation_memory.php).

Программы, разработанные на основе технологии Мachine Тranslation (машинный перевод), осуществляют связный перевод текста, используя определенные лингвистические алгоритмы. Сначала система анализирует структурные элементы входного предложения, затем преобразует его в соответствии со структурой языка и синтезирует окончательный вариант. Кроме того, для повышения качества перевода программа должна уметь распознавать устойчивые выражения, а также иметь большой словарный запас. Для перевода тематических текстов обычно требуется подключать специализированные словари. С помощью систем с технологией Machine Translation можно мгновенно получить черновой вариант перевода, когда необходимо быстро уловить общий смысл текста.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]