- •Лекція___ тема: ocr-системи. Призначення, види та використання Что такое ocr-системы
- •Процесс ввода документа в компьютер можно подразделить на два этапа:
- •Форматы, в которых FineReader сохраняет распознанный текст FineReader сохраняет результаты распознавания в следующих форматах:
- •Поддерживаемые графические форматы FineReader открывает файлы следующих форматов:
- •FineReader сохраняет изображения в следующих форматах:
- •Поддерживаемые языки распознавания
- •Основные языки
- •Дополнительные языки
- •Искусственные языки
- •Языки программирования
- •Языки со специализированными словарями
- •Сканирование
- •Преимущества одного режима перед другим
- •Чтобы запустить сканирование:
- •Установка параметров сканирования
- •Основными параметрами сканирования являются:
- •Чтобы установить параметры сканирования:
- •Сканирование многостраничных документов
- •При использовании автоподатчика (adf)
- •Без использования автоподатчика (adf)
- •Общая информация по распознаванию
- •Вы можете:
- •Чтобы запустить распознавание:
- •Распознавание в фоновом режиме
- •Проверка распознанного текста
- •Чтобы проверить результаты распознавания:
- •Перемещение по неуверенно распознанным словам
Дополнительные языки
абхазский
Относится к абхазо-адыгским (кавказским) языкам. Распространен в Грузии (Абхазия). Носителей около 105 тыс. чел.
аварский
Относится к аваро-андо-цезским (дагестанским) языкам. Распространен в России (Дагестан) и Азербайджане. Носителей около 600 тыс. чел.
агульский
Относится к лезгинским (дагестанским) языкам. Распространен в России (Дагестан, Ставропольский край) и Азербайджане. Носителей около 15 тыс. чел.
адыгейский
Относится к абхазо-адыгским (кавказским) языкам. Распространен в России (Адыгея, Краснодарский край). Носителей около 120 тыс. чел.
азербайджанский (кириллица), азербайджанский (латиница)
Официальный язык Азербайджана. Носители – по разным источникам от 14 до 20 млн. азербайджанцев в Иране, Азербайджане, Армении, Грузии.
аймара
Относится к семье кечумара индейских языков Южной Америки. Один из трех официальных языков Боливии. Количество носителей – около 2.2 млн. индейцев аймара в Перу и Боливии. Большинство владеет также родственным языком кечуа и испанским. Некоторые исследователи говорят не об одном языке, включающем около 10 диалектов, а о группе языков аймара.
албанский
Занимает изолированное положение внутри индоевропейской семьи языков. Официальный язык Албании. Количество носителей – около 5 млн. албанцев в Албании, Югославии (Косово), Италии, Греции.
алтайский
Относится к тюркским языкам. Распространен в России (Горный Алтай). Носителей около 55 тыс. чел.
африкаанс
Относится к германской группе индоевропейской семьи языков. Один из официальных языков ЮАР. Количество носителей – около 6.5 млн. чел. африканеров (буров) в ЮАР – потомков переселенцев из Нидерландов.
ацтекский
Относится к тано-ацтекским языкам. Распространен в Мексике. Носителей около 1 млн. чел.
баскский
Генетически изолированный язык. Носители – около 600 тыс. басков в Испании и Франции.
башкирский
Относится к тюркским языкам. Распространен в России (Башкирия, граничащие с ней области). Носителей около 1 млн. чел.
белорусский
Один из восточнославянских языков. Официальный язык Белоруссии. Носители – около 10,2 млн. чел. в Белоруссии.
бемба
Один из языков банту. Носители - около 5 млн. чел. в Замбии, Заире, Конго и Танзании.
блэкфут
Относится к западной группе алгонкинской семьи языков. Носители – менее 10 тыс. индейцев в США и Канаде.
бретонский
Относится к бриттской подгруппе кельтской группы языков. Носители – около 1 млн. бретонцев во Франции.
буготу
Относится к океанийским языкам малайско-полинезийской ветви австронезийских языков. Распространен на юго-восточных Соломоновых островах.
бурятский
Относится к монгольским языкам. Распространен в России (Бурятия). Носителей около 422 тыс. чел.
валлийский
Один из кельтских языков. Распространен в Уэльсе (Великобритания). Носителей около 580 тыс. чел.
волоф
Относится к западноатлантическим языкам. Официальный язык Сенегала. Распространен также в Гамбии и Мавритании. Носителей около 7 млн. чел.
гавайский
Один из австронезийских (полинезийских) языков. Распространен на Гавайских островах. Носителей около 20 тыс. чел.
гагаузский
Относится к тюркским языкам. Распространен на юге Молдавии. Носителей около 180 тыс. чел.
галисийский
Один из романских языков. Часто рассматривается как диалект испанского или португальского языков. Распространен в Испании (Галисия). Носителей около 4 млн. чел.
ганда
Один из языков банту. Распространен в Уганде. Носителей около 4 млн. чел.
гуарани
Относится к семье тупи-гуарани. Распространен в Парагвае, сопредельных ему районах Бразилии, Аргентины, а также в Боливии. Носители – около 5 млн. индейцев.
гэлао
Относится к кадайским языкам, занимающим промежуточное положение между тайскими и австронезийскими языками. Распространен в Китае. Носителей менее 50 тыс. чел.
гэльский (Шотландия)
Один из кельтских языков. Распространен в Шотландии, в т.ч. на Гебридских островах, также в Новой Шотландии (Канада). Носителей менее 100 тыс. чел.
дакота
Один из языков сиу. Распространен на севере США (Южная Дакота, Монтана). Носителей 20 тыс. чел.
даргинский
Относится к дагестанским языкам. Распространен в России (Дагестан). Носителей около 360 тыс. чел.
дун
Относится к тайским языкам. Распространен на юге Китая. Носителей около 700 тыс. чел.
дунганский
Относится к сино-тибетским языкам. Распространен в Киргизстане, Казахстане и Узбекистане. Носителей около 50 тыс. чел.
зулу
Один из языков банту. Распространен в ЮАР и Зимбабве. Носителей около 9,2 млн. чел.
ингушский
Один из нахских языков. Распространен в Ингушетии. Носителей около 200 тыс. чел.
индонезийский
Один из австронезийских языков. До 1945 года назывался малайским. Официальный язык Индонезии, используется для межнационального общения. Носителей около 160 млн. чел.
ирландский
Один из кельтских языков. Официальный язык Ирландии. Носителей 260 тыс. чел.
исландский
Один из скандинавских (германских) языков. Официальный язык Исландии. Носителей около 250 тыс. чел.
кабардино-черкесский
Один из абхазо-адыгских (кавказских) языков. Распространен в Кабардино-Балкарии, Карачаево-Черкесии, Северной Осетии (Моздок), Адыгее и прилегающих к ним районах Краснодарского и Ставропольского краев. Носителей около 300 тыс. чел.
казахский
Относится к тюркским языкам. Официальный язык Казахстана. Носителей около 8 млн. чел.
калмыцкий
Относится к монгольским языкам. Распространен в России (Калмыкия). Носителей около 140 тыс. чел.
каракалпакский
Один из тюркских языков. Распространен в Каракалпакии (Узбекистан). Носителей около 410 тыс. чел.
карачаево-балкарский
Один из тюркских языков. Иногда говорят об отдельных близкородственных карачаевском и балкарском языках. Распространен в России (Кабардино-Балкария, Карачаево-Черкесия). Носителей около 200 тыс. чел.
кашубский
Часто рассматривается как диалект польского языка. Распространен в Польше.
кечуа
Относится к языкам кечумара. Один из официальных языков Перу и Боливии. Распространен также в Эквадоре, на севере Колумбии, Чили и Аргентины. Носителей по разным источникам от 7 до 13 млн. индейцев.
кикуйю
Относится к языкам банту. Распространен в центре Кении. Носителей около 6 млн. чел.
киргизский
Относится к тюрским языкам. Официальный язык Кыргызстана. Рапространен также в Китае. Носителей около 2,6 млн. чел.
конго
Относится к языкам банту. Распространен в Конго, Заире, Анголе. Носителей около 10 млн. чел.
корсиканский
Обычно рассматривается как диалект итальянского языка. Распространен на острове Корсика. Носителей около 341 тыс. чел.
корякский
Относится к чукотско-камчатским языкам. Распространен в России (Корякский авт. округ). Носителей около 5 тыс. чел.
коса
Один из языков банту. Распространен в ЮАР. Носителей около 8 млн. чел.
кпелле
Относится к языкам манде. Распространен в Гвинее и Либерии. Носителей менее 1 млн. чел.
кроу
Один из языков сиу. Распространен в штате Монтана в США. Носителей менее 10 тыс.
крымскотатарский
Один из тюркских языков. Распространен на Украине (Крым). Носителей около 700 тыс. чел.
кумыкский
Относится к тюркским языкам. Распространен в России (Дагестан). Носителей около 282 тыс. чел.
курдский
Один из западно-иранских языков. Второй официальный язык Ирака. Распространен в Турции, Иране, Ираке, Сирии, странах СНГ (диаспора). Носителей около 20 млн. чел.
лакский
Относится к дагестанским языкам. Распространен в России (Дагестан). Носителей около 100 тыс. чел.
латинский
Относится к италийским языкам. Официальный язык Ватикана. В настоящее время как язык живого общения не используется.
лезгинский
Относится к дагестанским языкам. Распространен в России (Дагестан) и Азербайджане. Носителей около 450 тыс. чел.
луба
Относится к языкам банту. Распространен в Заире. Носителей около 6 млн. чел.
лужицкий
Один из западнославянских языков. Часто говорят об отдельных верхнелужицком и нижнелужицком языках. Распространен в Германии (Саксония). Носителей около 100 тыс. чел.
майя
Относится к семье майя-киче. Распространен в Мексике, Гватемале и Гондурасе. Носителей около 1 млн. индейцев.
македонский
Относится к южнославянским языкам. Официальный язык Македонии. Носителей около 2 млн. чел.
малагасийский
Относится к австронезийским языкам. Официальный язык Мадагаскара. Носителей около 10 млн. чел.
малайзийский
Относится к австронезийским языкам. Официальный язык Малайзии. Носителей около 20 млн. чел.
малинке
Относится к языкам манде. Распространен в Сенегале, Гвинее, Мали, Либерии, Сьерра-Леоне. Носителей около 4 млн. чел.
мальтийский
Один из семитских языков. Официальный язык Мальты. Носителей около 400 тыс. чел.
мансийский
Один из угорских языков. Распространен в России (Западная Сибирь). Носителей около 4 тыс. чел.
маори
Один из полинезийских языков. Распространен в Новой Зеландии. Носителей около 300 тыс. чел.
марийский
Общее название для двух близкородственных языков – марийского лугового и марийского горного. Распространены в России (Мари Эл, Татарстан). Относятся к финно-угорским (уральским) языкам. Носителей около 600 тыс. чел.
минангкабау
Относится к австронезийским языкам. Распространен на острове Суматра (центральная и западная части). Носителей около 6,5 млн. чел.
могавк
Относится к ирокезским языкам. Распространен на северо-востоке США и прилегающих районах Канады (озеро Онтарио и Эри). Носителей около 10 тыс. чел.
молдавский
Относится к романским языкам. Официальный язык Молдавии. Часто рассматривается как территориальная разновидность румынского языка. Носителей около 3 млн. чел.
монгольский
Относится к монгольским языкам. Официальный язык Монголии. Распространен также в Китае (Внутренняя Монголия). Носителей около 5 млн. чел.
мордовский
Общее название для двух близкородственных языков: мокша-мордовского и эрзя-мордовского. Относятся к финно-волжским (уральским) языкам. Распространены в России (Мордовия). Носителей около 1 млн. чел.
мяо
Относится к семье мяо-яо. Распространен в Китае, Вьетнаме, частично в Лаосе и Таиланде. Носителей около 8 млн.
немецкий (Люксембург)
Один из официальных языков Люксембурга. Обычно рассматривается как мозельско-франкский диалект немецкого языка.
ненецкий
Относится к самодийским (уральским) языкам. Распространен в России (Ямало-Ненецкий,Долгано-ненецкий авт. округа). Носителей около 25 тыс. чел.
нивхский
Генетически изолированный язык. Распространен в России (Сахалин, Приамурье). Носителей около 1 тыс. чел.
ногайский
Относится к тюркским языкам. Распространен в России (Карачаево-Черкесия, Краснодарский край). Носителей около 55 тыс. чел.
ньянджа
Один из языков банту. Официальный язык Малави. Распространен также в Замбии, Мозамбике и Зимбабве. Носителей около 7 млн. чел.
оджибве
Относится к алгонкинским языкам. Распространен в США и Канаде. Носителей несколько тысяч индейцев.
окситанский
Один из романских языков. Распространен на юге Франции и в Альпийской Италии. Носителей по разным источникам от 2 до 10 млн. чел.
осетинский
Относится к восточно-иранским языкам. Распространен в России (Северная Осетия) и Грузии (Южная Осетия). Носителей около 600 тыс. чел.
папьяменто
Креольский язык на основе испанского языка. Распространен на островах Аруба, Бонайре и Кюрасао. Носителей менее 1 млн. чел.
ретороманский
Один из романских языков. Один из официальных языков Швейцарии. Носителей около 40 тыс. чел. (кантон Граунбюнден).
руанда
Один из языков банту. Один из официальных языков Руанды. Распространен также в Бурунди, Заире, Уганде и Танзании. Носителей около 12 млн. чел.
рунди
Один из языков банту. Один из официальных языков Бурунди. Распространен также в Танзании и Заире. Носителей около 7 млн. чел.
русский (старая орфография)
Относится к индоевропейским (славянским) языкам.
саамский
Относится к финно-угорским языкам. Распространен на севере Норвегии, Швеции, Финляндии, России (Кольский полуостров). Носителей около 50 тыс. чел.
самоа
Один из полинезийских языков. Один из официальных языков Западного Самоа. Носителей около 430 тыс. чел.
сапотек
Один из индейских языков. Распространен на юге Мексики. Носителей около 430 тыс. чел.
свази
Один из языков банту. Официальный язык Свазиленда. Распространен также на северо-востоке ЮАР. Носителей около 2 млн. чел.
себуанский
Относится к филиппинским (австронезийским) языкам. Распространен в центре Филиппинского архипелага. Часто рассматривается не как отдельный язык, а как группа близкородственных языков (бисайские). Носителей около 24 млн. чел.
селькупский
Один из самодийских (уральских языков). Распространен в России (Красноярский край, Томская область). Носителей около 2 тыс. чел.
сербский (кириллица), сербский (латиница)
Один из южнославянских языков (см. также хорватский). Официальный язык Югославии. Носителей около 20 млн. чел.
словенский
Один из южнославянских языков. Официальный язык Словении. Распространен также в граничащих с ней районах Австрии и Италии. Носителей около 2 млн. чел.
сомали
Один из афразийских (кушитских) языков. Официальный язык Сомали. Распространен также в Джибути, Эфиопии, Кении. Носителей около 11 млн. чел.
суахили
Один из языков банту. Основной язык межнационального общения в центральной и восточной Африке (особенно в Танзании и Кении). Официальный язык Уганды. Носителей, по разным источникам от 10 до 50 млн. чел.
сунданский
Один из австронезийских языков. Распространен в Индонезии (запад острова Ява). Носителей около 27 млн. чел.
табасаранский
Один из дагестанских языков. Распространен в России (Дагестан). Носителей около 75 тыс. чел.
тагальский
Один из филиппинских (австронезийских) языков. Официальный язык Филиппин. Носителей около 35 млн. чел.
таджикский
Один из иранских языков. Официальный язык Таджикистана. Распространен также в Узбекистане. Носителей около 4,5 млн. чел.
таити
Относится к полинезийским (австронезийским) языкам. Официальный язык Французской Полинезии. Распространен также в Новой Каледонии и Вануату. Носителей около 117 тыс. чел.
ток-писин
Креольский язык на основе английского языка. Официальный язык Папуа-Новой Гвинеи. Носителей около 3 млн. чел.
тонга
Относится к полинезийским (австронезийским) языкам. Официальный язык Тонга. Распространен также в Новой Зеландии, Фиджи, Западном Самоа. Носителей около 120 тыс. чел.
тсвана
Относится к языкам банту. Распространен в Ботсване и ЮАР. В Ботсване является одним из официальных языков. Носителей около 4 млн. чел.
тувинский
Относится к тюркским языкам. Распространен в России (Тыва). Носителей около 240 тыс. чел.
туркменский
Относится к тюркским языкам. Официальный язык Туркменистана. Носителей около 6,5 млн. чел.
удмуртский
Относится к пермским языкам. Распространен в России (Удмуртия, Кировская обл.). Носителей около 550 тыс. чел.
узбекский (кириллица),узбекский (латиница)
Один из тюркских языков. Официальный язык Узбекистана. Носителей около 31 млн. чел. Распространен также в Китае, Афганистане.
фарерский
Один из германских (островных скандинавских) языков. Официальный язык Фарерских островов (область Дании с большой автономией). Распространен также в некоторых других областях Дании. Носителей около 47 тыс. чел.
фиджи
Один из австронезийских (восточно-океанийских языков). Распространен на островах Фиджи. Носителей около 350 тыс. чел.
фризский
Один из германских языков. Распространен во Фрисландии (Нидерланды), на Северных Фризских островах, острове Гельголанд, Затерланде (ФРГ). Носителей около 730 тыс. чел.
фриульский
Один из романских языков. Часто рассматривается как один из ретороманских языков. Распространен в Италии (область Фриули-Венеция-Джулия). Носителей около 700 тыс. чел.
хакасский
Относится к тюркским языкам. Распространен в России (Хакасия). Носителей около 60 тыс. чел.
хани (акха)
Один из сино-тибетских (лоло-бирманских языков). Распространен в Китае (юг Юньнани), на севере Мьянмы, Таиланда, Лаоса и Вьетнама. Носителей около 1 млн. чел.
хантыйский
Относится к угорским языкам. Распространен в России (Тюменская и Томская обл.). Носителей около 15 тыс. чел.
хауса
Один из афразийских (чадских) языков. Распространен в Нигерии, Нигере, Камеруне, Гане, Бенине, Того. Носителей около 40 млн. чел.
цзинпо (качин)
Относится к тибето-бирманским языкам. Распространен на юге Китае и в Мьянме. Носителей около 600 тыс. чел.
цыганский
Один из индийских языков. Распространен в цыганской диаспоре по всему миру. Носителей по разным источникам от 1 до 5 млн. чел.
чаморро
Относится к малайзийско-полинезийской ветви австронезийских языков. Распространен в западной Микронезии, в частности, на острове Гуам. Носителей около 78 тыс. чел.
чеченский
Относится к нахской подгруппе северокавказской семьи языков. Носители – около 1 млн. чел. в России (Чечне, Ингушетии и Дагестане).
чувашский
Один из тюркских языков. Распространен в России (Чувашия). Носителей около 2 млн. чел.
чукотский
Один из чукотско-камчатских языков. Распространен в России (Чукотский, Корякский автономные округа). Носителей около 10 тыс. чел.
шона
Один из языков банту. Распространен в Зимбабве, Мозамбике, Ботсване и ЮАР. Носителей около 8 млн. чел.
эвенкийский
Относится к тунгусо-манчжурским языкам. Распространен в Китае, России (от Енисея до Сахалина), Монголии. Носителей около 30 тыс. чел. (в России – около 10 тыс.).
эвенский
Относится к тунгусо-манчжурским языкам. Распространен в России (Охотское побережье, Якутия, Магаданская область). Носителей около 5 тыс. чел.
эскимосский (кириллица),эскимосский (латиница)
Относится к эскимосско-алеутским языкам. Распространен на юго-востоке Чукотского полуострова (Россия), на Аляске с прилегающими островами (США), в арктической зоне Канады, в Гренландии. Носителей около 100 тыс. чел.
южный сото
Один из языков банту. Один из официальных языков Лесото. Распространен также в ЮАР. Носителей около 8 млн. чел.
якутский
Один из тюркских языков. Распространен в России (Якутия). Носителей около 400 тыс. чел.