Лексические функции и машинный перевод

В лаборатории компьютерной лингвистики ИППИ РАН проводится разработка действующей компьютерной модели естественного языка на основе известной лингвистической теории "Смысл <--> Текст" И.А.Мельчука (1974). В семантическом компоненте модели самым существенным образом используется большое количество сведений о каждом слове моделируемого языка, которые помещаются в словарных статьях так называемого толково-комбинаторного словаря (ТКС). Одним из важнейших типов лексикографической информации, содержащейся в словарной статье некоторого слова X, являются максимально широкие сведения о тех словах, которые регулярным образом связаны с ключевым словом X по смыслу, а именно:

а) его парадигматические варианты или замены - слова или словосочетания, которые могут заменять X в тех или иных контекстах;

б) его синтагматические партнеры или параметры - лексические единицы, которыми некоторые общие смыслы идиоматично выражаются при данном слове X.

Для обозначения таких связанных с X слов используется термин лексические корреляты, а для описания зависимости между словом X и его лексическими коррелятами применяется аппарат лексических функций (ЛФ). Соответственно, используются два типа ЛФ - ЛФ-замены и ЛФ-параметры. Идеология лексических функций и разработка перечня основных ЛФ принадлежат И.А.Мельчуку, А.К.Жол-ковскому и Ю.Д.Апресяну.

Организация информации о лексических функциях и работа с ними в системе МП должна удовлетворять следующим основным принципам:

- информация о ЛФ в словарной статье комбинаторного словаря (КС), точно так же, как и сведения о синтаксических и семантических признаках слова и его модели управления, носит внутриязыковой характер. Она касается самого ключевого слова статьи и не должна быть ориентирована на перевод его лексических коррелятов на конкретный выходной язык, и может быть использована, в равной степени, при перифразировании или при переводе на какой-либо третий язык.

- информация о ЛФ в статье КС должна записываться в форме, привычной лингвистам, и быть максимально лаконичной.

- информацию о ЛФ следует использовать в точно определенных местах алгоритма МП (а не "размазывать" ее по всем этапам алгоритма).

- включение в МП работы с ЛФ ни при каких обстоятельствах не должно ухудшить качества МП.

Основным практическим приложением разработанной модели является система машинного перевода ЭТАП-3, в которой воплощены многие принципы этой лингвистической теории [Апресян и др. 1989, 1992; Apresjan et al. 1992, 1993]. Рабочие языки системы - русский и английский. Перевод между ними осуществляется в обе стороны, однако система располагает и экспериментальными компонентами русско-французского, русско-немецкого и русско-корейского перевода. После создания формализованного варианта ЛФ появилась возможность ввести этот материал в русский и английский словари ЭТАП-3 и включить в несколько систем лингвообработки, а именно:

- системы англо-русского и русско-английского МП;

- системы перифразирования в рамках одного языка (русского или английского);

- комбинированные системы "перевод+перифразирование" (перифра-зирование может осуществляться как во входном, так и в выходном языках).

<<< < Предыдущая 1 2 34 / 94 5 6 7 8 9 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
11.11.20192.47 Mб21финансовое 10new.doc
#
13.11.2018560.13 Кб23Финансовое право (учебное пособие).doc
#
17.09.2019226.82 Кб13финансы и кредит.doc
#
30.07.201997.79 Кб25Фонетика ответы Спектр.docx
#
26.04.201930.55 Кб18фонетика.docx
#
20.07.2019170.5 Кб8Форм решения в МП.doc
#
16.11.2019102.91 Кб1Формирование ДА у дошкольников.doc
#
15.08.201959.39 Кб11фразеология (теория) (1).doc
#
18.08.2019165.57 Кб24Французкий.docx
#
14.07.2019154.11 Кб4ФУНКЦИОНАЛЬНО.docx
#
03.08.20194.26 Mб45хаймович-роговская курс теор грамматики.rtf