- •Вопросы к экзамену по курсу «Информационные технологии»
- •Понятие и свойства информации.
- •Основные направления искусственного интеллекта, экспертные системы
- •2)Работа с естественными языками
- •3)Накопление и использование знаний
- •4)Биологическое моделирование
- •5)Робототехника
- •6)Машинное творчество
- •Информация и знания. Виды знаний. Базы данных и базы знаний.
- •2)Знания в книгах. 3)знания в электронных книгах. 4)знания в Интернете.
- •Роль языка в интеллектуальных информационных системах. Структура лингвистической базы данных.
- •Компьютерная лингвистика, ее предмет и задачи. Соотношение теоретической и компьютерной лингвистики.
- •Способы представления знаний о языке в лингвистической базе данных. Классификация множеств элементов по n. Признакам.
- •Способы представления знаний о языке в лингвистической базе данных. Симметрично-асимметричные матрицы.
- •, 9) Типы машинных словарей. Словарь машинных основ и машинных флексий, его достоинства и недостатки.
- •Словарь словоформ, его достоинства и недостатки.
- •2 Основных формата машинных словарей:
- •Основные типы машинных грамматик.
- •Этапы автоматического анализа текста.
- •Уровни понимания микротекста. Моделирование понимания в интеллектуальных системах.
- •Машинный (автоматический) перевод как одно из направлений искусственного интеллекта. Стратегии машинного перевода.
- •Действующие промышленные системы машинного перевода.
- •Лингвистические проблемы при автоматическом переводе и способы их решения.
- •1.Проблема словаря.
- •2.Проблема грамматики.
- •Дистанционное обучение - перспективное направление информационных технологий. Компьютер как средство обучения.
- •Типы обучающих компьютерных программ. Учебно-методические комплексы и их составляющие.
- •Основные принципы и этапы создания обучающих систем.
- •Информационно-поисковые системы, принципы их работы. Перспективы интеллектуализации информационно-поисковых систем.
- •Лингвистические ресурсы Интернета. Электронные библиотеки.
- •10 Продолжение
- •13.2.3. Иерархия Хомского и контекстно-зависимые грамматики
Действующие промышленные системы машинного перевода.
Системы машинного перевода различаются по тому признаку, на каком уровне в них осуществляется анализ текста.
В некоторых системах предпринимается попытка полностью проанализировать входной текст, вплоть до получения представления на промежуточном языке, а затем сформировать из этого представления предложения на целевом языке. Такая задача является сложной, поскольку она включает в качестве подзадачи проблему полного понимания языка, а к этому добавляются все сложности, связанные с применение промежуточного языка. К тому же такой подход является ненадежным, поскольку в случае неудачного завершения анализа не формируются также выходные данные. А его преимуществом является то, что нет таких частей системы, функционирование которых основано на знании одновременно двух языков. Это означает, что может быть создана система с промежуточным языком, позволяющая переводить тексты с одного из η языков на другой за счет трудозатрат, пропорциональных О (n), а не (дальше не для филологовJ)
Другие системы основаны на так называемом методе передачи. В них имеется база данных, состоящая из правил перевода (или примеров), а перевод осуществляется непосредственно путем согласования текста с правилами (или примерами). Передача может осуществляться на лексическом, синтаксическом или семантическом уровне. Например, строго синтаксическое правило преобразует английское словосочетание [Adjective Noun] (adjective— имя прилагательное, noun— имя существительное) во французское словосочетание [Noun Adjective]. А, допустим, смешанное синтаксическое и лексическое правило устанавливает соответствие между французским выражением [S1 "et puis" S2] и английским [S1 "and then" S2]. Передача, выполняемая с непосредственным преобразованием одного предложения в другое, известна под названием метода ^ перевода с помощью памяти, поскольку она основана на запоминании большого множества пар (английский, французский). Метод передачи является надежным, поскольку он всегда обеспечивает выработку пусть даже каких-то выходных данных и при этом по меньшей мере хотя бы часть полученных слов обязательно оказывается правильной.
Действующие системы машинного перевода, как правило, ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения. Современные аппаратные и программные средства допускают использование словарей большого объема, содержащих подробную грамматическую информацию. Информация может быть представлена как в декларативной (описательной), так и в процедурной (учитывающей потребности алгоритма) форме.
История
В СССР с середины 70-х годов были созданы промышленные системы машинного перевода с английского языка на русский АМПАР (на основе исследований и разработок коллектива Ю. А. Моторина), с немецкого языка на русский НЕРПА, с французского языка на русский ФРАП, автоматические терминологические словари в помощь человеку-переводчику. Система АМПАР длительное время находилась в промышленной эксплуатации; впоследствии на ее базе были созданы более эффективные системы МП для персональных компьютеров семейства СПРИНТ; была также разработана система МП с русского языка на английский АСПЕРА. На этих разработках основываются такие системы машинного перевода, как Stylus, Socrat и другие.
Интенсивность работ по МП в разные периоды времени различная. Нынешний период характеризуется некоторым спадом интереса к проблеме, по сравнению, например, с шестидесятыми годами. Мода на машинный перевод прошла, многие его энтузиасты давно занялись другими делами. Современное состояние машинного перевода, если его характеризовать несколько критически и в сопоставлении с тем, что имело место ранее, характеризуется некоторыми вялотекущими научными исследованиями, существованием определенного количества практически работающих и продающихся на рынке программного обеспечения систем МП в разных странах, и появляющимися время от времени сообщениями о разработке новых систем.
В настоящее время существует множество коммерческих проектов машинного перевода.
Примеры систем машинного перевода:
DEJA VU
Pragma 4.0
PROMT FAMILY
TRADOS 6 FREELANCE