Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
АСПЗ_ Системи розпізнавання_ПВ.doc
Скачиваний:
2
Добавлен:
07.05.2019
Размер:
140.29 Кб
Скачать

5. Перехід від розпізнавання алфавіту однієї мови до багатомовного читання

Система оптичного розпізнавання також може бути використана для зчитування адрес міжнародної пошти, у тому числі написаних іноземними мовами. Після ідентифікації країни поштове відправлення пересилається до цієї країни для подальшої обробки, де відбувається більш детальне розпізнавання, обробка та пересилання до місця призначення.

Система також може зчитати в яке місто прямує поштове відправлення і, таким чином, воно буде направлене у відповідний район цієї країни, без проходження додаткового етапу сортування. Цей процес залежить від вимог поштової служби тієї чи іншої країни. Пошту, яка пересилається між США та Канадою, сортують і за провінціями, і за містами, розпізнаються адреси, написані на обох мовах: французькій та англійській.

Логотип

та адреса

відправника

МАРКА ПОШТОВА

1 грн

Розпізнавання логотипів Розпізнавання марок та інших знаків поштової

оплати, в т.ч. позначок матричного штрихкоду

Розпізнавання наклейок

З ПОВІДОМЛЕННЯМ

Виділення рекламних та художніх зображень

Зчитування адрес

Адреса

одержувача

Зчитування шрихкодів

І І І І І І ШШШШШ ІІІІІІІІІІІ Ш

Рисунок 72. Приклад аналізу та ідентифікації поштової інформації

Компанією Siemens вже вирішені задачі розпізнавання різномовних алфавітів, включно із кирилицею [].

У кожної абетки і кожної письмової системи існують свої труднощі. Тексти арабською мовою мають набагато більше крапок, ніж тексти, написані латинськими літерами. Проте, на відміну від англійського, арабський текст неможливо прочитати без крапок над «і». В цих крапках зосереджений головний зміст тексту. Кирилиця і латиниця мають багато спільного—одна третина обрисів літер співпадає, хоча вони і вимовляються по-різному. Тому в таких коротких текстах, як адреса, буває важко розрізнити за допомогою якої абетки написано адресу.

Тексти китайською мовою не мають відступів між словами, адже текст є типографічно неструктурованим. Для того, щоб зрозуміти, де закінчуються слова, необхідно прочитати та зрозуміти їх—проте щоб прочитати слова, потрібно знати, де вони починаються і де закінчуються. Це зачароване коло і являє собою серйозну проблему, яку необхідно вирішити.