udav писал(а):Да, увы, у меня нашлись далеко не все... Но 1966 и 1997 есть. Ничего, если будет легкая полосатость от сканера? И по качеству как - требуется, чтобы соответствовало другим номерам к единому знаменателю?
Хорошее качество это залог легкого распознавания текста.
Мой алгоритм был следующим
Сканирую в разрешением 300dpi в сером режиме (градация серого). Некоторые сканеры при сканировании в цветном режиме медленнее, некоторые также как и в сером. Но главное не сканировать в черно-белом режиме. В цветном или сером режиме я сканироаю, но затем все сканы я экспортирую в серые tiff сжатые по методу LZW. Сканирую и экспортирую я файнридером.
Когда сырые сканы готовы я прогоняю их через Scan Tailor, мне кажется это лучшее решение для рядового пользователя, не проффи. Вот ветка на руборде
http://forum.ru-board.com/topic.cgi?for ... rt=1500#lt там обсуждают различные версии и перспективы развития + ссылки на свежие дистрибутивы в шапке форума.
Естественно с цветными вклейками работа отдельная в фотошопе.
После обработки в Scan Tailor мы получаем черно-белые tiff с выровненными полями, с разделенными разворотами. Затем они экспортируются в djvu, цветные вклейки экспортирую отдельно в щадящем режиме.
Затем распознавание и прикрепление текстового слоя к djvu и прикрепление оглавления.
Если вам позволяет интернет можете загрузить на какой-нибудь файлообменник архив с сырыми серыми сканами ежегодника за 1966 год. Я их обработаю и перегоню в DJVU. За 97-й может подождать, там вполне читабельная электронная версия, лишь у некоторых страниц "съедены" буквы по углам.