Интернет-журнал "Домашняя лаборатория", 2008 №3
Шрифт:
Space — переход к следующему файлу
Shift+C — выбор заранее определенного размера выделения
Enter — наложение выделения на изображение
Почему порядок действий не такой, как было рассказано выше? Удобнее получается, если после нажатия клавиши исполнения макроса, на изображение уже будет наложена рамка, останется подвинуть ее правой мышью и опять нажать клавишу. Это реализуется при помощи любой программы, работающей с клавиатурными макросами. Макрос назначается на наиболее удобную клавишу, допустим, CapsLock. При первом запуске вручную набираем Shift+C, жмем Enter, правой мышью тащим рамку, жмем Ctrl+Y, затем S, выбираем папку, жмем Enter.
Если на листе две страницы, нужно сделать по одной на файл, а автоматическая резка бесполезна из-за кривизны, придется сделать два прохода: один для левых, другой для правых страниц на каждом листе, иначе возникнет проблема с именами файлов. После первого прохода нужно указать другую папку или переименовать уже полученные файлы.
Какой софт выбрать для работы с клавиатурными макросами? Можно AutoRecorder, но нажимать функциональные кнопки не очень удобно. Это легко исправить при помощи программы RSI KeySwap, в ней можно мгновенно переназначить F7 на любую другую кнопку. Для клавиатурных макросов хорошо подходит KeyboardRemapper. Сами макросы в обычном текстовом виде, как и у AutoRecoder, их легко редактировать, сама программа простая и маленькая, всего 500 кил, не требует инсталляции, можно быстро вернуться к исходной раскладке клавиатуры. Подходят также русский KeyManiac или китайский KeystrokeConverter.
Разрезание страниц на две части или обрезку черных областей по краям тоже можно сделать с помощью Ирфана. Процесс выбора параметров обрезки не так удобен и нагляден, но ничего сложного нет. Создаем папку для результирующих файлов, открываем меню "Файл — Преобразовать/Переименовать группу файлов…", выбираем файлы, устанавливаем опции формата и заходим в "Настроить параметры". В левом верхнем углу отмечаем пункт "Обрезать", как на скриншоте:
В меню приняты следующие обозначения: X — горизонтальная ось, Y — вертикальная, есть четыре точки начала координат X и Y: "Слева сверху", "Справа сверху", "Слева снизу" и "Справа снизу". Исходным является размер изображения в пикселах. Например, есть изображение шириной 2000 и высотой 4000 пикселов. Надо обрезать горизонтальную полосу сверху размером в 150 пикселов. Точные размеры обрезки определяются путем выделения прямоугольника курсором на дисплее, значения видны в заголовке Ирфана на синем фоне. Ставим начало координат "Слева сверху", "Точка X" = 0, поскольку не будет обрезки по ширине, "Точка Y" = 150, в графу "Высота" заносим разность между исходным размером и обрезкой: 4000-150=3850. Жмем "ОК" и запускаем выполнение операции кнопкой "Старт". Все изображения будут обрезаны сверху на 150 пикселей. Аналогичным образом выполняется обрезка по горизонтали или по двум смежным сторонам. Проделать такую операцию в один прием на противоположных сторонах не получится. Разделение страниц на две равные или неравные части делается в два прохода, сначала одну половину, затем вторую. В установках "Обрезать" сначала выбирается "Слева сверху", по оси X вводится половина ширины изображения, ось Y=0, в графе "Высота" проставляется исходная высота изображения, в графе "Ширина" такое же значение, как для оси X, то есть, половина ширины. При втором проходе меняется только начало координат, теперь это будет "Справа сверху".
Обратите внимание на вторую красную стрелку "Перезаписывать существующие файлы", эта опция позволяет экономить место на винте при пакетных операциях, например, при двойном
После завершения обработки файлов, они кодируются в djvu, об этом было рассказано в начале статьи.
ФОРМАТЫ, РЕСЭМПЛИНГ И FINEREADER
Когда возникает вопрос, — в каком формате, цвете и при каком разрешении сканировать тот или иной бумажный оригинал? — то однозначного ответа нет, выбор будет зависеть от каждого конкретного случая. Рассмотрим плюсы и минусы очевидных вариантов:
1) черно-белый tif Fax4 при 300dpi подходит для журналов и книг с четкой печатью и достаточно крупным шрифтом:
— в плюсах достаточно высокая скорость сканирования и приемлемое качество;
— в минусах практическое отсутствие возможности что-либо скорректировать, при неправильном подборе яркости высока вероятность появления мусора в виде точек, полос и т. д., вдобавок при кодировании в djvu, особенно в режиме lossy, появление уже упомянутых ошибок, когда одни буквы заменяются на другие — "и" и "н" и т. д.;
2) черно-белый tif Fax4 при 600dpi подходит для большинства печатной продукции, даже с относительно мелким шрифтом:
— в плюсах резкое снижение вероятности ошибок при кодировании в djvu;
— в минусах та же самая невозможность коррекции, мусор, резкое увеличение размера файлов, что не так важно при дальнейшем кодировании в djvu;
3) серый tif LZW при 300 dpi является основным режимом сканирования, как для черно-белых, так и для серых бумажных оригиналов:
— в плюсах возможность самых различных коррекций изображения, искусственное повышение разрешения (ресэмплинг, о нем пойдет речь далее), скорость сканирования не ниже, чем для черно-белого;
— в минусах разве что увеличение размеров файлов при сканировании, что не так критично, и необходимость обработки, если нужно получить черно-белое;
4) серый tif LZW при 600 dpi лучше применять только для самых плохих оригиналов:
— в минусах низкая скорость сканирования и последующей обработки, а также катастрофическое увеличение размеров файлов. Этот режим стоит использовать только в исключительных случаях, когда со сканами предполагается серьезная работа в графических редакторах или конвертерах;
— в плюсах очень высокое качество, практически это разумный предел;
5) цветной tif LZW при 300 и 600 dpi подходит для текстовых страниц с цветными иллюстрациями, вкладок, обложек, когда качество, как текста, так и цвета, достаточно критично. В чистом виде используется сравнительно редко, поскольку скорость сканирования низкая, размеры файлов огромные, обработка требует значительного времени, смысл есть только при последующем кодировании в djvu;
6) серый и цветной jpg может использоваться исключительно для тех случаев, когда текста мало, сам текст крупный, а фотографий много.
Категорически не рекомендуется использовать jpg для текстовых оригиналов!
Это самый верный способ безвозвратно испортить скан, поскольку сжатый jpg по своей сути является форматом lossy, то есть, с потерями и со стопроцентным появлением, так называемых, артефактов. Что это такое? Смотрите сами:
Это слово было отправлено на печать в виртуальный принтер FinePrint и сохранено в формате tif LZW. Никаких отличий с оригиналом нет, если не считать того, что фонт вместо вектора стал графикой и при увеличении появились неровные края букв, поскольку это растр, а не масштабируемый фонт. А теперь то же самое, но в формате jpg: