Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Диссертация по мат.семантике.doc
Скачиваний:
16
Добавлен:
07.11.2018
Размер:
2.47 Mб
Скачать

1.5. Единство формальных и смысловых характеристик слова в искусственных языках для машинного перевода

1.5.1. Системы типа «Интерлингво» и машинный перевод

В последнее время в области систем машинного перевода господствует идея о необходимости создания систем Интерлингво. То есть все существующие языки должны переводиться на Интерлингво и обратно с Интерлингво. В результате можно было бы получать перевод с любого языка A на язык B, применяя цепочку A-I-B, где I есть язык Интерлингво. «Один из наиболее известных проектов interlingua-системы разрабатывается в Голландии под названием Distributed Language Translation (DLT, infoweb.magi.com /~mfettes /DLT.html). Эта разработка началась в 1979 году и была свернута к 1992 году. Но не успела она завершиться, как запустился новый Интерлингво-проект UNL или Universal Network Language. На этот раз (в 1997 году) инициаторами выступили японцы. Возникновение этого проекта непосредственно связано с потребностью перевода документов в Интернете. [27] Последний проект состоит в идее сопоставления словам неких атрибутов, отличающих их различные лексико-семантические варианты.

1.5.2. Проблемы создания языка описания семантики

Вопрос об международном искусственном языке без полисемии и конфигуральных условностей особенно активно разрабатывался в конце XIX века. Всего в мире насчитывается более 1000 проектов таких языков. Единственный язык такого рода, получивший относительно широкое распространение среди энтузиастов – язык Эсперанто. Он на сегодняшний день содержит около 1900 корней (в основном латинского происхождения) [24]. Эсперанто был основан на схожести многих европейских языков и содержит, таким образом, много схожих с другими языками слов. Грамматика Эсперанто отличается логичностью и простотой. Обширно словообразование в языке Эсперанто. Вектор признаков, определяющий каждое слово в предлагаемой в работе модели языка, может быть использован для построения слов языка типа Интерлингво. Для этого необходимо каждому значению элемента нашего понятийного вектора сопоставить определенную букву и звук или же иероглифическую ассоциативную картинку. При этом можно получить язык, содержащий в себе неограниченное количество производных от этих значений слов [88].

Существуют другие искусственные языки, такие как Basic English, содержащие 1000 слов и описывающий весь вокабуляр словосочетаниями видоизмененного английского языка [41].

Помимо традиционной цели искусственные языки международного общения могут иметь следующие области применения.

1. Для анализа языка.

2. Для общения с компьютерными программами и для их разработки.

Селиверстова О. Н., говоря о языке в широком смысле, пишет следующее: «Словарь семантического языка в идеале, который пока ни кем не был достигнут, должен удовлетворять следующему условию: каждое его слово должно выражать ровно одно, по возможности, элементарное значение, а все элементарные значения должны выражаться ровно одним словом семантического языка, совершенно не зависимо от того, в составе какого толкования оно встречается [41]», то есть такой язык должен удовлетворять требованиям детерминированности и однозначности.

Предлагаемый в работе словарь порождения языковых единиц полностью реализует эту задачу. В авторской постановке задачи сама структура дерева классификации. заданная вектором семантических признаков, является своего рода языком типа Интерлингво, поскольку все потенциально существующие узлы дерева классификации могут соответствовать словам того или иного языка. Все это делает ЕЯ интерфейсы единообразными для любых естественных языков. В работе указывается, что предлагаемая классификация слов и понятий языка, спроецированная на фонетическую систему, позволяет задать искусственный язык типа Интерлингво, и может использоваться для кодирования позиции слова в базах данных и в системах взаимодействия с программным обеспечением на естественном языке.