- •Бизнес на сканировании и оцифровке книг Бизнес идея. Сканирование книг
- •Содержание
- •Методика оцифровки[править | править вики-текст]
- •Книжные сканеры[править | править вики-текст]
- •Профессиональные книжные сканеры[править | править вики-текст]
- •Сканирование с обрезкой страниц[править | править вики-текст]
- •Обрезка страниц[править | править вики-текст]
- •Сканирование[править | править вики-текст]
- •Сканирование без вмешательства[править | править вики-текст]
- •Крупные проекты по оцифровке книг[править | править вики-текст]
- •Оцифровка по желанию[править | править вики-текст]
- •Существующие проекты[править | править вики-текст]
- •См. Также[править | править вики-текст]
- •Электронные книжные коллекции
- •Что нужно?
- •Оцифровка печатных текстов
- •Содержание
- •Об электронных книгах[править]
- •Правовые аспекты[править]
- •Форматы djvu и pdf[править]
- •Приспособления для сканирования
- •У Google новые проблемы с проектом оцифровки книг
Содержание
[убрать]
1 Методика оцифровки
2 Книжные сканеры
3 Профессиональные книжные сканеры
4 Сканирование с обрезкой страниц
4.1 Обрезка страниц
4.2 Сканирование
5 Сканирование без вмешательства
6 Крупные проекты по оцифровке книг
7 Оцифровка по желанию
7.1 Существующие проекты
8 См. также
9 Ссылки
10 Примечания
Методика оцифровки[править | править вики-текст]
Имеется викиучебник по теме «Оцифровка книг»
В прошлом чаще применялся ручной набор текста книги.
Сегодня процесс оцифровки включает два подхода.
Обязательный: получение копий страниц в виде графических (обычно растровых) изображений, осуществляемое путём сканирования или фотографирования с последующей обработкой и сохранением в одном из форматов графических файлов. В этом случае полностью сохраняется оригинальная вёрстка книги, и исключаются какие-либо ошибки, однако невозможен поиск или извлечение фрагментов текста для, например, целей цитирования.
Опциональный: распознавание текста (технология «оптического распознавания символов» — OCR) с последующим сохранением распознанного текста в одном из форматов электронных книг. В этом случае становится возможен полнотекстовый поиск по книге и индексация больших массивов электронных книг, однако затрудняется воспроизведение оригинальной вёрстки, изображений, схем и формул, практически неизбежны становятся ошибки распознавания.
В последнее время (особенно с появлением форматов PDF и DjVu) всё чаще применяется смешанный подход: текст книги распознаётся в автоматическом режиме и подкладывается под оригинальные растровые изображения страниц, что позволяет совместить преимущества обоих подходов.
Книжные сканеры[править | править вики-текст]
К книжным сканерам относятся узкоспециализированные сканеры, предназначенные для максимально быстрого и/или удобного получения растровых копий страниц книги. Условно можно выделить три типа таких сканеров:
планшетные — сканеры, ориентированные на домашнего пользователя, но сконструированные именно для облегчения процесса сканирования книг.
планетарные — профессиональные высокопроизводительные сканеры.
роботизированные (англ.) — промышленные сверхвысокопроизводительные сканеры, оборудованные устройствами различных конструкций для автоматического переворачивания страниц.
В двух последних типах сканеров обычно применяется не сканирующая линейка, а одна расположенная над сканируемым оригиналом цифровая камера высокого разрешения (30—140 мегапикселей). В некоторых моделях возможно использование двух камер, которые устанавливаются под углом друг относительно друга так, чтобы одновременно делать снимки всего разворота (при этом нет необходимости раскрывать книгу на 180°, что критично при оцифровке старых или находящихся в плохом состоянии оригиналов).
Планетарные и роботизированные сканеры позволяют достичь производительности 500—2000 страниц в час, у лучших моделей — до 2500—3000 страниц в час.[источник не указан 678 дней]
Профессиональные книжные сканеры[править | править вики-текст]
Эскиз V-формы книжного сканера ATIZ
Эскиз типичного книжного сканера
Профессиональные книжные сканеры не просто обычные сканеры, это книжные сканеры, которые сканируют в высоком качестве с использованием цифровой камеры и источниками света по обе стороны от камеры, обеспечивающие легкий доступ к книге. Преимуществом таких сканеров является то, что это очень быстрые сканеры, по сравнению с производительностью планшетного сканера. Однако цены таких сканеров обычно начинаются с 10 000$.