- •Isbn 978-5-9765-0098-3 (Флинта) isbn 978-5-02-034597-3 (Наука)
- •1.1.2. Методы воспроизведения и обработки данных
- •1.1.3. Понятие информации
- •1.1.4. Понятие контекстного метода
- •1.2. Данные
- •1.2.2. Операции
- •1.3.2. Классификация прикладных программ
- •1.3.3. Периферийные устройства
- •1.4. Интеллектуальные информационные системы
- •1.4.1. Искусственный интеллект (Artificial Intelligence)
- •1.4.2. Нейронные сети
- •1.4.3. Экспертные системы
- •2. Обзор лингвистических программ
- •2.1.1. Текстовые процессоры
- •2.1.3. Генераторы текстов и «говорящие» программы
- •2.2. Машинный перевод
- •2.2.1. Основные этапы развития машинного перевода
- •2.2.2. Как переводит компьютер
- •2.2.3. Классификация систем
- •2.3. Компьютерная лингвистика: нестандартные применения
- •2.3.1. Определение языка сообщения
- •2.3.2. Взлом шифров
- •2.3.3. Установление авторства
- •2.3.4. Построение роботов-поисковиков и снифферов
- •Заключение
- •Приложение
- •Оглавление
- •1 . Информация. Информационные
- •1.1. Информация 3
- •Информационный обмен, сигналы, данные 3
2.1.3. Генераторы текстов и «говорящие» программы
Компания «Сакрамент» основана в Минске в 1994 г. и на сегодняшний день является одним из ведущих разработчиков программного обеспечения в области систем распознавания и синтеза русской речи.
51
Компания «Сакрамент» предлагает услуги:
■ .
по внедрению своих систем синтеза и распознавания речи в программное обеспечение и оборудование заказчика;
по разработке программного обеспечения с использованием своих достижений в области речевых технологий.
Реализация голосового интерфейса в компьютерной технике позволяет не только сделать ее доступной для людей с ослабленным зрением или ограниченной дееспособностью, но и предоставляет возможность всем пользователям перейти на качественно новый уровень работы с ПК.
«Модуль синтеза и распознавания речи» может быть реализован как программно, так и аппаратно, что обеспечивает возможность внедрения его и в различные программные продукты, и в офисную технику. Речевой интерфейс в программных продуктах позволяет не только осуществлять выполнение команд, но и совершать голосовую навигацию по настройкам меню.
Идентификация голоса
Голосовая идентификация является одной из ветвей развития технологии обработки речи и применяется при создании различных систем охраны или систем ограничения доступа. Программные и аппаратные средства идентификации голоса человека преследуют одну главную цель — убедиться в том, что говорящий является именно тем, за кого себя выдает, либо идентифицировать незнакомого человека.
Распознавание речи
Технология распознавания речи предоставляет возможность распознавания отдельных слов или слитной человеческой речи с последующим ее преобразованием в текст либо последовательность команд. Эта технология используется при создании средств речевого управления — программ, управляющих действиями компьютера или другого электронного устройства с помощью голосовых команд, а также при организации телефонных справочных и информационных служб.
52
Синтез речи
Синтез речи — возможность обработки текстовой или числовой информации согласно установленным правилам произношения для конкретного языка и преобразование ее в синтезированный голос, по восприятию близкий к человеческому.
Система синтеза русской речи, созданная минской компанией «Сакрамент», полностью соответствует стандарту Microsoft Speech API (SAPI) 5.1. Она позволяет произносить тексты мужским и женским голосом, делая при этом интонационные паузы, изменяя по желанию пользователя тон и тембр речи.
2.2. Машинный перевод
Почему машинам с трудом дается перевод?
Отчасти потому, что он с трудом дается всем, даже людям.
Дуг Арнольд, профессор университета
г. Эссекса (Великобритания)
2.2.1. Основные этапы развития машинного перевода
1947 — дата рождения машинного перевода (МП) как научного направления. Уоррен Уивер, директор отделения естественных наук Рокфеллеровского фонда, написал письмо Норберту Винеру, в котором рассматривал задачу перевода текстов с одних языков на другие как еще одну область применения техники дешифрования. За этим письмом последовало множество дискуссий.
— А. Бут и Д. Бриттен разработали подробный «код» для пословного машинного перевода.
— Р. Риченс предложил правила разбиения словоформ на основу и окончание.
1952 — первая конференция по МП в Массачусетском технологическом институте.
1954 — представлена первая система МП — IBM Mark II — русско-английская, которая имела словарь в 250 единиц и 6
53
грамматических правил. Последовавшее за этим десятилетие было временем бурного развития МП.
1967 — специально созданная в США Комиссия Национальной Академии наук, исходя из реальной ситуации с переводами в США и показателей стоимости различных способов перевода, пришла к выводу о том, что машинный перевод нерентабелен. Доклад существенно затормозил развитие МП в целом.
70-е годы — возрождение интереса к работам в области МП. С развитием вычислительной техники появились новые возможности машинной реализации лингвистических алгоритмов.
80-е годы — время работы персональных компьютеров значительно подешевело, машинный перевод наконец-то стал экономически выгодным.
90-е годы — отмечается очередной рост интереса к машинному переводу, что связано с появлением и бурным развитием Internet/ Intranet. Преимущества использования машинного перевода особенно очевидны при получении онлайнового перевода.
В 1990 г. Ларри Чаилдс, специалист по машинному переводу, предложил следующую классификацию систем машинного перевода:
FAMT (Fully-automated machine translation) — полностью ав томатизированный машинный перевод;
НАМТ (Human-assisted machine translation) — машинный перевод при участии человека;
МАНТ (Machine-assisted human translation) — перевод, осу ществляемый человеком с использованием компьютера.
■ ■ ■