- •Вопрос 1. Схема абстрактного технологического процесса. Классы информационных технологий, их состав, примеры.
- •3. Логическая и физическая структура документа. Разметка. Виды разметки.
- •Вопрос 4. TeX. Разработчики. Наиболее известные варианты. Преимущества.
- •Вопрос 7. Xml и xhtml. Описание элемента и списка атрибутов в xml. Спецификация описания типа документа в xml, альтернативная dtd.
- •Вопрос 9. Процесс сжатия mp3.Понятие биттрейта. Характеристики стандартных биттейтов при сжатии звука.
- •Вопрос 10. Кодирование стереосигнала в мр3. Форматы хранения аудиоинформации.
- •Вопрос 12. Форматы графических файлов.
- •Вопрос 13. Принцип оцифровки изображения. Режимы цветопередачи при оцифровке изображения. Понятие интерполяционного повышения разрешения. Три основных способа интерполяции. Twain.
- •3 Основные способа интерполяции:
- •Полноцветный
- •Вопрос 15. Моделирование и конфигурирование сцены в процессе построения трехмерной компьютерной модели.
- •Вопрос 17. Ocr. Общая характеристика. Основные принципы. Основные методы.
- •Вопрос 18. Технологический процесс использования abbyy Fine Reader. Принципы ipa.
- •Вопрос 19. Общий принцип mda. Классификаторы, используемые при распознавании символов в abbyy Fine Reader.
- •Вопрос 20. Технологии распознавания речи. Общие принципы распознавания речи. Акустическая и лингвистическая модели.
- •Вопрос 21. Классификация систем распознавания речи. Применение систем распознавания речи.
- •Вопрос 22. Критерии оценки качества озвучивания речи. Факторы, влияющие на озвучивание слов. Основные подходы к озвучиванию речи.
- •Модуль лингвистической обработки.
- •Вопрос 24. Этапы процесса машинного перевода. Фразеологический машинный перевод.
- •26. Защита файлов. Общий подход и подход unix. Организация многопользовательского доступа к файлам.
- •Вопрос 27. Файловая система ntfs.
- •Вопрос 30. Язык sql. Понятие транзакции. Свойства acid-транзакций.
- •Вопрос 31. Основные функции субд. Основные структурные элементы субд. Функции утилит администратора бд.
- •Вопрос 33. Коммутация пакетов. Эталонная модель взаимодействия открытых систем. Базовые сетевые топологии.
- •Вопрос 35. Протоколы электронной почты. Почтовые клиенты. Распределенные файловые системы Internet.
- •Вопрос 36. Распределенные информационные системы Интернет.
- •Вопрос 38. Клиент-серверные архитектуры распределенной обработки данных.
- •Вопрос 40. Схемы размещения и доступа к данным в распределенных бд. Управление параллельной обработкой в распределенной бд.
- •Вопрос 41. Технологии и средства удаленного доступа. Odbc, rpc.
- •Вопрос 42. Dcom.
- •Вопрос 43. Информационная безопасность. Защита информации. Меры информационной безопасности. Наиболее распространенные угрозы. Принципы анализа угроз.
- •Вопрос 44. Меры программно-технической безопасности.
- •Вопрос 45. Криптографические методы защиты информации.
- •Вопрос 46. Компьютерные вирусы и защиты от них. Средства защиты данных в субд. Защита информации в сетях.
Вопрос 17. Ocr. Общая характеристика. Основные принципы. Основные методы.
Оптическое распознавание символов Optical Character Recognition
Общие принципы распознавания:
В ходе сканирования печатного текста получается растровое изображение текста а не сам текст.
OCR – получение текста как последовательности символов из растрового изображения.
Первые исследования в области OCR проводились в 50-е гг 20 века, принципы заложенные в то время используется в большинстве современных систем OCR - Сравнение изображения с имеющимися эталонами и выбор наиболее подходящего.
Современная OCR технология включает в себя 2 аспекта:
Считывание исходного документа универсальным сканером и формирование растрового изображения
Распознавание путем программной обработки изображения
Основные методы OCR
Сопоставление матриц – (сравнение с образцом) распознавание выполняется путем сравнения изображения отсканированного символа с базой данных растровых, успешно работает только с пропорциональными шрифтами, где символы четко отделяются друг от друга. Описание символов с использованием матрицы.
Выделение признаков – распознавание символа основывается на идентификации их универсальных особенностей, что позволяет сделать распознавание независимым от шрифтов. Если считать что все символы могут быть идентифицированы с использованием правил, по которым элементы букв (дуги прямой окружности) присоединяются друг к другу то все символы описываются и распознаются не зависимо от шрифта. Описание правил написания символов. Практические результаты использования этого метода весьма чувствительны к качеству печати. Идентификация битов изображения, относящаяся к шуму (искажения) стала отдельной областью исследований.
Некоторые средства сначала используют сравнение с образцом или выделение признаков для распознавания максимального количества символов, а затем уточняют результат, используя грамматическую проверку получающегося текста.
Прогнозирующее распознавание слов – POWR predictive optical word recognition – анализируется все множество способов, которыми точки изображения могут быть собраны в слово. Каждой возможной интерпретации приписывается некоторая вероятность, к распознаванию подключаются алгоритмы анализа – эксперты – каждый эксперт аккумулирует в себе знания о некоторой тематической области распознавания (о начертании, устранению шума в словарях).
Вопрос 18. Технологический процесс использования abbyy Fine Reader. Принципы ipa.
Технологический процесс ABBYY Fine Reader:
1) Сканирование процесса;
2) Ручная или автоматическая разметка областей, требующая различной обработки;
3) Распознавание, создание и вывод на экран текстового файла с объектами таблицы и рисунок, контроль правильности(ручной, полуавтоматический, автоматический), вывод информации в файл базового формата.(doc,xls, rtf)
4) Сканирование выполняют в цветном режиме или в режиме grayscale, если нет необходимости сохранять цвета, можно также использовать режим цветовой графики lineart, однако при этом есть риск потерять детали существенные для распознавания.
Принципы функционирования Fine Reader(принципы IPA):
1) Принцип целостности Integrity. Объект рассматривается как целое, состоящее из связанных частей, части связаны пространственными отношениями и получают своё толкование в рамках гипотезы об объектах;
2) Принцип целенаправленности Purposefulness. Любая интерпретация данных преследует определённую цель, распознавание представляет собой процесс выдвижения гипотез в объекте и их целенаправленной проверки;
3) Принцип адаптивности Adaptability(информация, полученная в процессе распознавания накапливается и может использоваться в дальнейшем для решения аналогичных задач.