- •Бизнес на сканировании и оцифровке книг Бизнес идея. Сканирование книг
- •Содержание
- •Методика оцифровки[править | править вики-текст]
- •Книжные сканеры[править | править вики-текст]
- •Профессиональные книжные сканеры[править | править вики-текст]
- •Сканирование с обрезкой страниц[править | править вики-текст]
- •Обрезка страниц[править | править вики-текст]
- •Сканирование[править | править вики-текст]
- •Сканирование без вмешательства[править | править вики-текст]
- •Крупные проекты по оцифровке книг[править | править вики-текст]
- •Оцифровка по желанию[править | править вики-текст]
- •Существующие проекты[править | править вики-текст]
- •См. Также[править | править вики-текст]
- •Электронные книжные коллекции
- •Что нужно?
- •Оцифровка печатных текстов
- •Содержание
- •Об электронных книгах[править]
- •Правовые аспекты[править]
- •Форматы djvu и pdf[править]
- •Приспособления для сканирования
- •У Google новые проблемы с проектом оцифровки книг
Крупные проекты по оцифровке книг[править | править вики-текст]
В ходе масштабных проектов по оцифровке книг, как правило, обрабатываются книги, перешедшие в общественное достояние. Хотя Google оцифровывает вообще все книги, однако книги, защищённые авторским правом, предоставляет лишь в виде фрагментов. К крупным проектам по оцифровке на сегодня относятся:
Google Book Search;
проект «Гутенберг»;
проект Gallica Национальной библиотеки Франции;
проект Europeana Европейской комиссии;
проект openlibrary от Archive.org и др.
Одной из основных проблем является большой объём книг, которые будут отсканированы. Десятки миллионов книг будут отсканированы, а затем должны находиться в свободном доступе и поиске в интернете в качестве универсальной библиотеки. В настоящее время крупные организации полагаются на аутсорсинг или сканирование дома с использованием профессиональных или роботизированных сканеров.
Что касается аутсорсинга, то книги часто отправляются оцифровываться в Индию или Китай, за счет самых низких цен. Профессиональные сканеры используют цифровые камеры, что значительно ускоряет весь процесс. При использовании роботизированных сканеров традиционно необходимо отделять страницы от корешка книги, чтобы страницы могли автоматически подаваться.
Как только страница сканируется, данные вводятся вручную или с помощью OCR, что является еще одним критерием стоимости сканирования книги. В связи с вопросами авторского права на большинство отсканированных книг не распространяется авторское право. Однако известно, что Google Book Search сканирует книги, которые защищены авторским правом, и может убрать книгу из свободного доступа, только если издатель специально исключит книгу из поиска.
Оцифровка по желанию[править | править вики-текст]
Ряд крупных библиотек предоставляют особые услуги по оцифровке публикаций из своих фондов по желанию читателей. Основные критерии: публикации должны находиться в общественном достоянии и должны быть в достаточной сохранности. Таким образом, появляется источник финансирования процесса оцифровки или же устанавливаются приоритеты при массовой оцифровке. Как правило, отметка о возможности сканирования интегрирована в библиотечный каталог, оцифрованная публикация размещается в электронной библиотеке для всеобщего доступа.
Существующие проекты[править | править вики-текст]
«Scan-on-demand» (Сканирование по требованию) — бесплатный проект от openlibrary.org, любой желающий может выбрать книгу из списка (фонды Бостонской общественной библиотеки), который содержит большое количество литературы XIX—XX веков на русском языке. Оцифровка проводится средствами некоммерческой организации Архив Интернета. Сроки работ заявлены как 5—8 рабочих дней. На сайте openlibrary.org собрано уже более миллиона оцифрованных публикаций.[1]
«DigiWunschbuch» — проект Центра оцифровки и Университетской государственной библиотеки Гёттингена (Германия), сканирование за плату (рассчитывается постранично) заказчик получает цифровую копию на CD-ROMе, кроме того, его имя будет размещено на шмуцтитуле цифровой копии, размещённой в открытом доступе.[2]
См. Также[править | править вики-текст]
DjVu
PDF
ScanKromsator
Scan Tailor
Deskew
Dewarping
Шумопонижение
reCAPTCHA
Ссылки[править | править вики-текст]
Оцифровка книг в Викиучебнике? | |
Оцифровка книг на Викискладе? |
Всё о книгосканировании — самоучители, программы, помощь в выборе ПО и сканера, ссылки на материалы в Интернете
Примечания[править | править вики-текст]
↑ http://openlibrary.org/bpl
↑ DigiWunschbuch: WUNSCHBÜCHER
Комплекс услуг для библиотек
Восполнение книжных фондов библиотек или музеев, помощь в организации новых направлений развития и предложения комплекса услуг своим читателям, создание электронных коллекций.
Наше издательство постоянно ведет совместную работу с ведущими научными центрами страны, такими как Российская национальная библиотека, Библиотека Российской академии наук, Библиотека Санкт-Петербургского государственного университета и др., и имеет возможность оказывать услуги по подбору,комплектованию, сканированию, оцифровке и изготовлению редких книг для библиотек страны. Многолетний опыт работы в данной области, профессиональное оборудование и новейшие информационные технологии позволяют нам сохранить редкие книги и документы и в то же время сделать их максимально доступными читателям в виде качественных факсимильных копий или в виде оцифрованных, подготовленных по техническим требованиям заказчика электронных книжных коллекций. Мы предлагаем следующий комплекс услуг:
Подбор тематических изданий в крупных российских библиотеках, музеях и архивах, выполненный специалистами-библиографами. Поиск и оцифровка книг, документов, изображений, альбомов иллюстраций и картографических материалов краеведческой тематики, оригиналы которых отсутствуют в фондах региональных библиотек;
Поиск оригиналов в российских фондохранилищах, выявление неполных изданий (страниц/частей/томов) и их доукомплектование. Составление библиографических списков по тематике или региону при необходимости;
Сканирование изданий на профессиональном оборудовании с базовой автоматической обработкой электронных образов страниц изданий;
Компьютерная обработка отсканированных имиджей по техническим требованиям заказчика. Полная, тщательная чистка и подготовка электронных образов всех страниц и обложек изданий;
Формирование полных готовых электронных версий изданий в формате PDF, а также дополнительных облегченных версий для просмотра или размещения на сайте. Проведение процедуры полнотекстового распознавания в полученных электронных образах, проверка текста;
Создание электронного и, при необходимости, бумажного каталога коллекции подготовленных электронных версий. Формирование базы данных с полнотекстовым поиском по электронным версиям изданий;
Формирование отдельного нового электронного информационного ресурса с поисковыми возможностями и возможностью открытия/чтения электронных версий изданий на компьютерах в читальных залах и других устройствах. Адаптация, интеграция передаваемых электронных изданий в существующую систему электронной библиотеки;
Изготовление факсимильных и репринтных печатных изданий, максимально приближенных к оригиналам.