- •Вопрос 1. Схема абстрактного технологического процесса. Классы информационных технологий, их состав, примеры.
- •3. Логическая и физическая структура документа. Разметка. Виды разметки.
- •Вопрос 4. TeX. Разработчики. Наиболее известные варианты. Преимущества.
- •Вопрос 7. Xml и xhtml. Описание элемента и списка атрибутов в xml. Спецификация описания типа документа в xml, альтернативная dtd.
- •Вопрос 9. Процесс сжатия mp3.Понятие биттрейта. Характеристики стандартных биттейтов при сжатии звука.
- •Вопрос 10. Кодирование стереосигнала в мр3. Форматы хранения аудиоинформации.
- •Вопрос 12. Форматы графических файлов.
- •Вопрос 13. Принцип оцифровки изображения. Режимы цветопередачи при оцифровке изображения. Понятие интерполяционного повышения разрешения. Три основных способа интерполяции. Twain.
- •3 Основные способа интерполяции:
- •Полноцветный
- •Вопрос 15. Моделирование и конфигурирование сцены в процессе построения трехмерной компьютерной модели.
- •Вопрос 17. Ocr. Общая характеристика. Основные принципы. Основные методы.
- •Вопрос 18. Технологический процесс использования abbyy Fine Reader. Принципы ipa.
- •Вопрос 19. Общий принцип mda. Классификаторы, используемые при распознавании символов в abbyy Fine Reader.
- •Вопрос 20. Технологии распознавания речи. Общие принципы распознавания речи. Акустическая и лингвистическая модели.
- •Вопрос 21. Классификация систем распознавания речи. Применение систем распознавания речи.
- •Вопрос 22. Критерии оценки качества озвучивания речи. Факторы, влияющие на озвучивание слов. Основные подходы к озвучиванию речи.
- •Модуль лингвистической обработки.
- •Вопрос 24. Этапы процесса машинного перевода. Фразеологический машинный перевод.
- •26. Защита файлов. Общий подход и подход unix. Организация многопользовательского доступа к файлам.
- •Вопрос 27. Файловая система ntfs.
- •Вопрос 30. Язык sql. Понятие транзакции. Свойства acid-транзакций.
- •Вопрос 31. Основные функции субд. Основные структурные элементы субд. Функции утилит администратора бд.
- •Вопрос 33. Коммутация пакетов. Эталонная модель взаимодействия открытых систем. Базовые сетевые топологии.
- •Вопрос 35. Протоколы электронной почты. Почтовые клиенты. Распределенные файловые системы Internet.
- •Вопрос 36. Распределенные информационные системы Интернет.
- •Вопрос 38. Клиент-серверные архитектуры распределенной обработки данных.
- •Вопрос 40. Схемы размещения и доступа к данным в распределенных бд. Управление параллельной обработкой в распределенной бд.
- •Вопрос 41. Технологии и средства удаленного доступа. Odbc, rpc.
- •Вопрос 42. Dcom.
- •Вопрос 43. Информационная безопасность. Защита информации. Меры информационной безопасности. Наиболее распространенные угрозы. Принципы анализа угроз.
- •Вопрос 44. Меры программно-технической безопасности.
- •Вопрос 45. Криптографические методы защиты информации.
- •Вопрос 46. Компьютерные вирусы и защиты от них. Средства защиты данных в субд. Защита информации в сетях.
Вопрос 20. Технологии распознавания речи. Общие принципы распознавания речи. Акустическая и лингвистическая модели.
Технологии распознавания речи
С теоретической точки зрения представление речи виде текста является крайней степенью сжатия звукового речевого сигнала.
Первый серьезный прорыв в 1986 г в DARPA – defense advanced research project agency (агентство перспективный исследований министерства обороны США)
Успех был связан с применением скрытой Марковской модели - HMM – hidden Markov model для моделирования озвучивания фонем в контексте.
Была реализована идея об ограниченности фонемного ряда и об ограниченности зависимости фонем от контекстного окружения.
Технологии распознавания речи – STT – speech to text – наибольшее применение находят в специфических областях, где голосовые команды являются наиболее приемлемым или даже единственно возможным решением – это удаленный доступ к автоматическим справочным системам, управление удаленным ПК или портативным мобильным устройством
Принципы распознавания речи
Даже подходы к структурной декомпозиции процесса распознавания речи и соответствующих механизмов разняться. Преобладает следующий подход:
Системы распознавания речи состоят из двух компонентов:
Акустической – отвечает за представление речевого сигнала
Лингвистической – интерпретирует информацию получаемую от акустической модели и отвечает за представление результата распознавания
Акустическая модель путем использования преобразования Фурье представляет звуковой сигнал временной последовательностью частотных характеристик, что позволяет отсеять посторонние шумы и несущественные созвучия.
Лингвистический блок содержит следующие слои (уровни):
Фонетический
Фонологический
Морфологический
Лексический
Синтаксический
Семантический
Каждый уровень подразумевает существование соответствующей модели (фонетической и т.д.) являющейся частью лингвистической модели. В эти модели вкладывается априорная информация о структуре и закономерностях языка. Лингвистическая модель является для каждого языка уникальной.
На фонетическом уровне производится преобразование звукового сигнала в последовательность фонем – т.е. минимальным звуковых единиц языка. Фонемы, присутствующие в реальном звуковом речевом сигнале являются аллофонами – варианты фонем зависящие от звукового окружения.
Результаты распознавания аллофонов сопоставляются с базой фонем, эффективность распознавания зависит от полноты базы (наличие в ней вариантов фонем, произнесенных людьми с различными особенностями произношения), эту часть системы распознавания называют системой независящей от говорящего.
При необходимости она дополняется системой зависящей от говорящего, ее можно натренировать на конкретного диктора, она фиксирует в своей базе основные речевые особенности и формирует профиль говорящего.
Выполнятся уточнение вариантов вырабатываемых фонетической модели при помощи ограничений. Ограничения описывают возможность сочетание фонем (аллофонов) и их вероятности. Для описания ограничений используют мат аппарат цепей Маркова. На морфологическом уровне фонемы складываются в морфемы (слогоподобные единицы речи). Лексическая модель поддерживает информацию о словах и словоформах и корректирует результаты работы морфологического уровня с точки зрения допустимости слов. На синтаксическом уровне получаются предложения. Семантический уровень предназначен для формирования модели отношений между объектами использованными в речи.