- •Вопрос 1. Схема абстрактного технологического процесса. Классы информационных технологий, их состав, примеры.
- •3. Логическая и физическая структура документа. Разметка. Виды разметки.
- •Вопрос 4. TeX. Разработчики. Наиболее известные варианты. Преимущества.
- •Вопрос 7. Xml и xhtml. Описание элемента и списка атрибутов в xml. Спецификация описания типа документа в xml, альтернативная dtd.
- •Вопрос 9. Процесс сжатия mp3.Понятие биттрейта. Характеристики стандартных биттейтов при сжатии звука.
- •Вопрос 10. Кодирование стереосигнала в мр3. Форматы хранения аудиоинформации.
- •Вопрос 12. Форматы графических файлов.
- •Вопрос 13. Принцип оцифровки изображения. Режимы цветопередачи при оцифровке изображения. Понятие интерполяционного повышения разрешения. Три основных способа интерполяции. Twain.
- •3 Основные способа интерполяции:
- •Полноцветный
- •Вопрос 15. Моделирование и конфигурирование сцены в процессе построения трехмерной компьютерной модели.
- •Вопрос 17. Ocr. Общая характеристика. Основные принципы. Основные методы.
- •Вопрос 18. Технологический процесс использования abbyy Fine Reader. Принципы ipa.
- •Вопрос 19. Общий принцип mda. Классификаторы, используемые при распознавании символов в abbyy Fine Reader.
- •Вопрос 20. Технологии распознавания речи. Общие принципы распознавания речи. Акустическая и лингвистическая модели.
- •Вопрос 21. Классификация систем распознавания речи. Применение систем распознавания речи.
- •Вопрос 22. Критерии оценки качества озвучивания речи. Факторы, влияющие на озвучивание слов. Основные подходы к озвучиванию речи.
- •Модуль лингвистической обработки.
- •Вопрос 24. Этапы процесса машинного перевода. Фразеологический машинный перевод.
- •26. Защита файлов. Общий подход и подход unix. Организация многопользовательского доступа к файлам.
- •Вопрос 27. Файловая система ntfs.
- •Вопрос 30. Язык sql. Понятие транзакции. Свойства acid-транзакций.
- •Вопрос 31. Основные функции субд. Основные структурные элементы субд. Функции утилит администратора бд.
- •Вопрос 33. Коммутация пакетов. Эталонная модель взаимодействия открытых систем. Базовые сетевые топологии.
- •Вопрос 35. Протоколы электронной почты. Почтовые клиенты. Распределенные файловые системы Internet.
- •Вопрос 36. Распределенные информационные системы Интернет.
- •Вопрос 38. Клиент-серверные архитектуры распределенной обработки данных.
- •Вопрос 40. Схемы размещения и доступа к данным в распределенных бд. Управление параллельной обработкой в распределенной бд.
- •Вопрос 41. Технологии и средства удаленного доступа. Odbc, rpc.
- •Вопрос 42. Dcom.
- •Вопрос 43. Информационная безопасность. Защита информации. Меры информационной безопасности. Наиболее распространенные угрозы. Принципы анализа угроз.
- •Вопрос 44. Меры программно-технической безопасности.
- •Вопрос 45. Криптографические методы защиты информации.
- •Вопрос 46. Компьютерные вирусы и защиты от них. Средства защиты данных в субд. Защита информации в сетях.
Модуль лингвистической обработки.
В данном модуле производится определение языка для многоязычной системы и отфильтровываются непроизносимые символы (знаки препинания). Выполняется нормализация текста, то есть разделение его на слова и остальные последовательности символов, подключаются специальные подблоки озвучения цифр
2) Модуль лингвистического анализа.
Во многих языках, в частности в русском, существует достаточно регулярное правило чтения – правило соответствия между буквами и фонемами, которые, однако, могут требовать предварительную расстановку ударения. В английском языке правило чтения очень не регулярно. Учитывается омонимия.
Подходы к формированию фонем:
1)автоматический фонемный транскриптор – перевод каждой буквы или словосочетания в некоторую фонему в соответствии с системой контекстных правил. Эффективной метода очень невысока, в случае если есть множество исключений, для этого формируют словарь.
2) Морфемный анализ слова – фонемы переводятся в морфы. Трудности связаны с наличием пограничных явлений на стыках морф.
3)Модуль формирования просодических характеристик – относятся его тональное, акцентное и ритмические характеристики. Блоки формирования просодических характеристик: расстановка синтагматических границ (пауз), приписывание ритмических и акцентных характеристик (длительности и энергия) и приписывание тональных характеристик (частота основного тона). При расстановке синтагматических границ определяются части высказывания (синтагмы), внутри которых энергетические и тональные характеристики ведут себя единообразно и которые человек может произнести на одном дыхании. При отсутствии пауз на границах слушающему кажется, что говорящий задыхается. Самое простое решение – ставить границы в соответствие со знаками пунктуации. Адекватная передача тональных характеристик – очень сложная задача, поскольку сопряжена его эмоциональная окраска, поэтому приписывание тональных характеристик как правило выполняется в рамках гипотезы о нейтральности интонации. Имеются множество продуктов для генерации речи, многие из них используют microsoft speech api.
Примеры: Monologue ( FirstByte), Text Assist, Говорящая мышь( клуб голосовых технологий при научном парке МГУ)
Вопрос 24. Этапы процесса машинного перевода. Фразеологический машинный перевод.
Системы автоматического и автоматизированного перевода текста.
Ручной перевод текста с одного языка на другой производится путем восприятия и понимания исходного текста и последующей передаче его смысла средствами языка. При этом переводятся не слова и словосочетания, а понятийные образы, формируемые текстом в сознании переводчика. К этому идеалу нужно стремиться при автоматическом переводе текста. Как минимум нужно оперировать не отдельными словами, а терминологическими сочетаниями и фразеологическими оборотами, которые можно выделить из текста и перевод которых позволит наиболее адекватно донести смысл фразы.
Обобщённая технология работы системы машинного перевода.
Три этапа процесса перевода:
1. Семантико-синтаксический анализ. Выявляется грамматическая структура текста, распознаются наименования понятий, устанавливаются отношения между понятиями.
2. Трансфер. Переход от наименований понятий и структуры текста на входном языке к наименованиям понятий и структуре текста на выходном языке.
3. Семантико-синтаксический синтез. Грамматическое оформление текста на выходном языке.
Машинный перевод отличает от машинного словаря наличием инструментария семантико-синтаксического анализа и синтеза. Машинный перевод оставляет человеку только работу по контролю исправления ошибок, выполняя всю основную работу по переводу. А компьютерный словарь является вспомогательным средством работы переводчика.
Фразеологический машинный перевод.
Концепция фразеологического перевода базируется на понимании того факта, что в естественных языках смысл лексических единиц более высокого уровня как правило не сводится к смыслу составляющих их лексических единиц более низкого уровня, например слов.
Принципы построения систем фразеологического машинного перевода:
1. Основными единицами языка и речи, которые прежде всего следует включать в машинный словарь, должны быть фразеологические единицы. Отдельные слова могут использоваться только в тех случаях, когда перевод со смыслами не возможен.
2. Кроме фразеологических единиц могут использоваться речевые модели.
3. Реальные тексты как правило являются политематическими. Отличаются друг от друга не столько словарным составом, сколько распределениями вероятностей появления в них различных слов. Поэтому для перевода необходим политематический словарь.
4. Словари большого объёма, необходимые при фразеологическом переводе, могут создаваться путем автоматизированной обработки билингва.
5. Кроме основного политематического словаря целесообразно использовать несколько дополнительных тематических словарей.
6. Полисемия. Разрешается путем использования словаря фразеологических словосочетаний и дополнительных тематических словарей.
7. Использование принципа аналогии в процедурах морфологического и синтаксического анализа и синтеза позволяет отказаться от хранения словаря большого объёма информации и порождать ее по мере необходимости в процессе перевода.
8. В системе фразеологического перевода должен быть предусмотрен интерактивный режим работы. Основная идея заключается в том, что система фразеологического перевода должна включать в состав базу знаний, содержащую переводные эквиваленты наиболее часто встречающихся фраз. Система должна последовательно пытаться переводить предложения целиком, входящие в него фразеологические сочетания и отдельные слова, если первые два этапа завершились неудачно. Результаты всех трех этапов согласуются с помощью процедур морфологического ….. Примеры: Сократ.
Билет № 25: Предпосылки появления концепции файлов и файловых систем. Физическая и логическая структура магнитного диска. Централизованные и изолированные файловые системы. Преимущества и недостатки.
Предпосылки появления концепции файлов и файловых систем:
До появления концепции файловых систем каждый разработчик прикладного ПО самостоятельно определял расположение каждой порции данных на носителе и планировал обмен между оперативной и внешней памятью.
Физическая и логическая структура магнитного диска:
Жёсткие магнитные диски представляют собой пакеты магнитных пластинок — платтеров, между которыми на одном рычаге двигается пакет магнитных головок. Шаг движения пакета головок является дискретным, а каждое положение пакету головок соответствует цилиндр магнитного диска. При разметке магнитного диска каждая дорожка размечается на одно и тоже количество блоков таким образом, что в каждый блок можно записать по максимуму одно и тоже число памяти. Таким образом для выполнения обмена с магнитным диском на уровне аппаратуры нужно указать номер цилиндра, номер поверхности, номер блока на дорожке и число байт, которое нужно прочитать или записать от начала этого блока.
Размер логических блоков файла совпадает или кратен размеру физического блока диска, и обычно выбирается равным размеру страницы виртуальной памяти, поддерживаемой аппаратурой компьютера и ОС. Логические блоки обычно называют кластерами.
Изолированные файловые системы. Каждое дерево файлов располагается целиком на одном логическом диске, представляющем собой физический дисковый пакет или раздел физического дискового пакета. Полное имя файлы начинается с имени диска. Такой способ был использован в файловых системах DEC — Digital Equipment Corp — и Microsoft.
Централизованные файловые системы: Вся совокупность каталогов и файлов представлена как единое дерево. Полное имя файла начинается с имени корневого каталога. Система сама запрашивает оператора об установке необходимых дисков, выполняя поиск файла по его имени. Впервые была реализована в операционной системе Miltics.
Преимущества и недостатки:
Централизованные файловые системы во многом удобнее изолированных: система управления файлами принимает на себя больше рутинной работы. Но в таких системах возникают существенные проблемы, если кому-то требуется перенести поддерево файловой системы на другую вычислительную установку