- •Вопросы к экзамену по курсу «Информационные технологии»
- •Понятие и свойства информации.
- •Основные направления искусственного интеллекта, экспертные системы
- •2)Работа с естественными языками
- •3)Накопление и использование знаний
- •4)Биологическое моделирование
- •5)Робототехника
- •6)Машинное творчество
- •Информация и знания. Виды знаний. Базы данных и базы знаний.
- •2)Знания в книгах. 3)знания в электронных книгах. 4)знания в Интернете.
- •Роль языка в интеллектуальных информационных системах. Структура лингвистической базы данных.
- •Компьютерная лингвистика, ее предмет и задачи. Соотношение теоретической и компьютерной лингвистики.
- •Способы представления знаний о языке в лингвистической базе данных. Классификация множеств элементов по n. Признакам.
- •Способы представления знаний о языке в лингвистической базе данных. Симметрично-асимметричные матрицы.
- •, 9) Типы машинных словарей. Словарь машинных основ и машинных флексий, его достоинства и недостатки.
- •Словарь словоформ, его достоинства и недостатки.
- •2 Основных формата машинных словарей:
- •Основные типы машинных грамматик.
- •Этапы автоматического анализа текста.
- •Уровни понимания микротекста. Моделирование понимания в интеллектуальных системах.
- •Машинный (автоматический) перевод как одно из направлений искусственного интеллекта. Стратегии машинного перевода.
- •Действующие промышленные системы машинного перевода.
- •Лингвистические проблемы при автоматическом переводе и способы их решения.
- •1.Проблема словаря.
- •2.Проблема грамматики.
- •Дистанционное обучение - перспективное направление информационных технологий. Компьютер как средство обучения.
- •Типы обучающих компьютерных программ. Учебно-методические комплексы и их составляющие.
- •Основные принципы и этапы создания обучающих систем.
- •Информационно-поисковые системы, принципы их работы. Перспективы интеллектуализации информационно-поисковых систем.
- •Лингвистические ресурсы Интернета. Электронные библиотеки.
- •10 Продолжение
- •13.2.3. Иерархия Хомского и контекстно-зависимые грамматики
-
Лингвистические проблемы при автоматическом переводе и способы их решения.
У госпожи Лавриненко конспект лекции начинается по теме Лингвистическе проблемы автоматического перевода с:
Л. перевод-перевод информации, записанной на 1-м языке, средствами 2-го, т.е. перекодировка информ.
Переводы бывают устными и письменными.
Виды у.п.
-
Перевод с листа(речь исходного языка содержиться на листе в готовом варианте).
-
Последовательный.
-
Синхронный(общественные выступления, сопровождаемые переводом).
Виды письменного п.
-
Полный.
-
Реферативный(только самое важное!).
-
Аннотационный(составление аннотации текста).
-
Перевод патентов - одновременный анализ графической и текстовой анализ.
-
Перевод заголовков.
Лингвистические проблемы при автоматическом переводе.
1.Проблема словаря.
язык - это живая система, которая развивается очень быстро: постоянно появляются новые слова, новые функции старых слов, и, вместе с новыми сущностями, новые значения.
-
Имена собственные.
-
Географические названия.
-
Проблема неологизмов.
-
Проблема полисемии и амонимии.
Для перевода важно правильно структурировать информацию, которая приписывается элементу базы, правильно выбрать этот самый элемент.
2.Проблема грамматики.
простые предложения система переводит (да и то, как мы
убедились - не все) почти без ошибок. Сложносочиненные, да и классические
примеры сложноподчиненных предложений тоже даются системе с относительной
легкостью. Однако как только возникает нестандартная ситуация (например,
одно придаточное предложение усложняется другим (или даже элементарное
вводной или пояснительной конструкцией) и, как следствие, разрывается) и
программа не находит подходящего алгоритма грамматического анализа - она
сразу забывает о синтаксисе и начинает элементарный пословный перевод,
формально (посредством флексий) пытаясь связать хотя бы рядом стоящие
слова. Эта попытка связать грамматически рядом стоящие слова вкупе
неправильным выбором значений некоторых слов еще более запутывает выходной
вариант.
Не разработана сопоставительная грамматика языков для автопревода.
3. Стилистические проблемы.
Качество перевода зависит от тематики и стиля исходного текста. Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Тем не менее для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в небольшой редакторской корректировке. Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.
Язык образен и не поддается полной алгоритмизации, а посему проблема полной
автоматизации перевода сводится следующей проблеме: научить машину мыслить
и оперировать образами - а эта проблема уже из области проблем
искусственного интеллекта, создание которого все еще является чем-то из
области фантастики.
Говоря о наиболее перспективных путях развития систем
автоматизации перевода, следует, вероятно, сосредоточиться на том, что
выполнимо на данный момент, то есть на создании более эффективных
электронных словарей с как можно более эффективным механизмом поиска и
индексации, с как можно более интегрированной системой словарных статей.
Если же брать во внимание развитие систем Машинного Перевода, то наиболее
перспективным направлением здесь окажется совершенствование подсистем
грамматического анализа и синтеза, а также увеличение объема
контекстуального охвата текста и совершенствование семантических цепочек с
целью более точного подбора значений слов.
Как переводит компьютер
Машинный перевод - это такая специфическая область применения компьютеров, в проблемах которой почти каждый ощущает себя более или менее специалистом .
Во-первых, всем ясно, что чем больше словарь, тем лучше перевод, значит, первая проблема - проблема создания больших словарей для систем.
Во-вторых, ясно, что система должна переводить такие предложения: ПРИВЕТ, КАК ДЕЛА? Значит, еще одна проблема - научить систему распознавать устойчивые обороты.
В-третьих, понятно, что предложение для перевода пишется по определенным правилам, по определенным правилам переводится, а значит есть еще одна проблема: записать все эти правила в виде программы. Вот, собственно, и все.
Самое интересное, что эти проблемы действительно являются основными при разработке систем машинного перевода, другое дело, что методы их решения известны далеко не всем и отнюдь не так просты, как может показаться.