Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ответы_по_ИТ.doc
Скачиваний:
51
Добавлен:
24.04.2019
Размер:
407.55 Кб
Скачать
  1. Модуль лингвистической обработки.

В данном модуле производится определение языка для многоязычной системы и отфильтровываются непроизносимые символы (знаки препинания). Выполняется нормализация текста, то есть разделение его на слова и остальные последовательности символов, подключаются специальные подблоки озвучения цифр

2) Модуль лингвистического анализа.

Во многих языках, в частности в русском, существует достаточно регулярное правило чтения – правило соответствия между буквами и фонемами, которые, однако, могут требовать предварительную расстановку ударения. В английском языке правило чтения очень не регулярно. Учитывается омонимия.

Подходы к формированию фонем:

1)автоматический фонемный транскриптор – перевод каждой буквы или словосочетания в некоторую фонему в соответствии с системой контекстных правил. Эффективной метода очень невысока, в случае если есть множество исключений, для этого формируют словарь.

2) Морфемный анализ слова – фонемы переводятся в морфы. Трудности связаны с наличием пограничных явлений на стыках морф.

3)Модуль формирования просодических характеристик – относятся его тональное, акцентное и ритмические характеристики. Блоки формирования просодических характеристик: расстановка синтагматических границ (пауз), приписывание ритмических и акцентных характеристик (длительности и энергия) и приписывание тональных характеристик (частота основного тона). При расстановке синтагматических границ определяются части высказывания (синтагмы), внутри которых энергетические и тональные характеристики ведут себя единообразно и которые человек может произнести на одном дыхании. При отсутствии пауз на границах слушающему кажется, что говорящий задыхается. Самое простое решение – ставить границы в соответствие со знаками пунктуации. Адекватная передача тональных характеристик – очень сложная задача, поскольку сопряжена его эмоциональная окраска, поэтому приписывание тональных характеристик как правило выполняется в рамках гипотезы о нейтральности интонации. Имеются множество продуктов для генерации речи, многие из них используют microsoft speech api.

Примеры: Monologue ( FirstByte), Text Assist, Говорящая мышь( клуб голосовых технологий при научном парке МГУ)

Вопрос 24. Этапы процесса машинного перевода. Фразеологический машинный перевод.

Системы автоматического и автоматизированного перевода текста.

Ручной перевод текста с одного языка на другой производится путем восприятия и понимания исходного текста и последующей передаче его смысла средствами языка. При этом переводятся не слова и словосочетания, а понятийные образы, формируемые текстом в сознании переводчика. К этому идеалу нужно стремиться при автоматическом переводе текста. Как минимум нужно оперировать не отдельными словами, а терминологическими сочетаниями и фразеологическими оборотами, которые можно выделить из текста и перевод которых позволит наиболее адекватно донести смысл фразы.

Обобщённая технология работы системы машинного перевода.

Три этапа процесса перевода:

1. Семантико-синтаксический анализ. Выявляется грамматическая структура текста, распознаются наименования понятий, устанавливаются отношения между понятиями.

2. Трансфер. Переход от наименований понятий и структуры текста на входном языке к наименованиям понятий и структуре текста на выходном языке.

3. Семантико-синтаксический синтез. Грамматическое оформление текста на выходном языке.

Машинный перевод отличает от машинного словаря наличием инструментария семантико-синтаксического анализа и синтеза. Машинный перевод оставляет человеку только работу по контролю исправления ошибок, выполняя всю основную работу по переводу. А компьютерный словарь является вспомогательным средством работы переводчика.

Фразеологический машинный перевод.

Концепция фразеологического перевода базируется на понимании того факта, что в естественных языках смысл лексических единиц более высокого уровня как правило не сводится к смыслу составляющих их лексических единиц более низкого уровня, например слов.

Принципы построения систем фразеологического машинного перевода:

1. Основными единицами языка и речи, которые прежде всего следует включать в машинный словарь, должны быть фразеологические единицы. Отдельные слова могут использоваться только в тех случаях, когда перевод со смыслами не возможен.

2. Кроме фразеологических единиц могут использоваться речевые модели.

3. Реальные тексты как правило являются политематическими. Отличаются друг от друга не столько словарным составом, сколько распределениями вероятностей появления в них различных слов. Поэтому для перевода необходим политематический словарь.

4. Словари большого объёма, необходимые при фразеологическом переводе, могут создаваться путем автоматизированной обработки билингва.

5. Кроме основного политематического словаря целесообразно использовать несколько дополнительных тематических словарей.

6. Полисемия. Разрешается путем использования словаря фразеологических словосочетаний и дополнительных тематических словарей.

7. Использование принципа аналогии в процедурах морфологического и синтаксического анализа и синтеза позволяет отказаться от хранения словаря большого объёма информации и порождать ее по мере необходимости в процессе перевода.

8. В системе фразеологического перевода должен быть предусмотрен интерактивный режим работы. Основная идея заключается в том, что система фразеологического перевода должна включать в состав базу знаний, содержащую переводные эквиваленты наиболее часто встречающихся фраз. Система должна последовательно пытаться переводить предложения целиком, входящие в него фразеологические сочетания и отдельные слова, если первые два этапа завершились неудачно. Результаты всех трех этапов согласуются с помощью процедур морфологического ….. Примеры: Сократ.

Билет № 25: Предпосылки появления концепции файлов и файловых систем. Физическая и логическая структура магнитного диска. Централизованные и изолированные файловые системы. Преимущества и недостатки.

Предпосылки появления концепции файлов и файловых систем:

До появления концепции файловых систем каждый разработчик прикладного ПО самостоятельно определял расположение каждой порции данных на носителе и планировал обмен между оперативной и внешней памятью.

Физическая и логическая структура магнитного диска:

Жёсткие магнитные диски представляют собой пакеты магнитных пластинок — платтеров, между которыми на одном рычаге двигается пакет магнитных головок. Шаг движения пакета головок является дискретным, а каждое положение пакету головок соответствует цилиндр магнитного диска. При разметке магнитного диска каждая дорожка размечается на одно и тоже количество блоков таким образом, что в каждый блок можно записать по максимуму одно и тоже число памяти. Таким образом для выполнения обмена с магнитным диском на уровне аппаратуры нужно указать номер цилиндра, номер поверхности, номер блока на дорожке и число байт, которое нужно прочитать или записать от начала этого блока.

Размер логических блоков файла совпадает или кратен размеру физического блока диска, и обычно выбирается равным размеру страницы виртуальной памяти, поддерживаемой аппаратурой компьютера и ОС. Логические блоки обычно называют кластерами.

Изолированные файловые системы. Каждое дерево файлов располагается целиком на одном логическом диске, представляющем собой физический дисковый пакет или раздел физического дискового пакета. Полное имя файлы начинается с имени диска. Такой способ был использован в файловых системах DEC — Digital Equipment Corp — и Microsoft.

Централизованные файловые системы: Вся совокупность каталогов и файлов представлена как единое дерево. Полное имя файла начинается с имени корневого каталога. Система сама запрашивает оператора об установке необходимых дисков, выполняя поиск файла по его имени. Впервые была реализована в операционной системе Miltics.

Преимущества и недостатки:

Централизованные файловые системы во многом удобнее изолированных: система управления файлами принимает на себя больше рутинной работы. Но в таких системах возникают существенные проблемы, если кому-то требуется перенести поддерево файловой системы на другую вычислительную установку