Чтение онлайн

на главную

Жанры

Интернет-журнал "Домашняя лаборатория", 2008 №3
Шрифт:

Разумеется, что для всех последующих операций можно использовать другой софт, например, ReaConverter 3.5 или Pic2Pic, в котором помимо всего остального, есть автоматическое исправление перекоса, но только для страниц с текстом. Есть масса других программ для групповой автоматической обработки графических файлов, все перечислить невозможно, поскольку требования могут быть самыми разными.

Четные и нечетные страницы будут иметь номера файлов согласно страницам, формат файлов tif LZW полноцветные. Если одна или несколько страниц имеют незначительный наклон, то его можно выправить в меню "Изображение — Повернуть на произвольный угол". Обычно 0,2°-0,5° бывает достаточно, для поворота против часовой

стрелки перед значением угла поставьте минус. После поворота нужно скорректировать размер при помощи опции "Изменить размер изображения…". Кроме того, глубина цвета становится равной 24 битам, при необходимости скорректируйте это значение.

Первой групповой операцией после поворота страниц будет уменьшение количества цветов до 256. Излишнее количество цветов значительно увеличивает размеры файла.

Действует правило:

• черно-белое — 1 бит;

• серое — 4 бита, но значительно чаще, 8 бит;

• цветное — 8 бит, если нет особых требований к передаче цвета.

Такой подход разумен для сканированных изображений с последующим кодированием в djvu. В этом же меню есть цветовая коррекция и прочие настройки, на скриншоте красными стрелками отмечены наиболее нужные опции:

Можно скорректировать сразу все файлы, записав необходимые параметры в соответствующие графы установок при пакетном преобразовании в Ирфане. Грязные страницы можно почистить от мусора вручную, нужно только установить белый фон в двух местах меню "Сервис-Настройки программы-Разное 3-Цвет фона", это уже упоминалось выше:

По нажатию Ctrl+X выделенная курсором часть изображения станет белой. С помощью Ctrl+Y вырезается только нужная часть изображения. После коррекции обязательно сохраните изображение нажатием "S" или "Ctrl+S", Ирфан не спрашивает об автоматическом сохранении, поэтому можно потерять коррективы, внесенные в файл. Полученные после сканирования файлы будут идентичны по размеру в пикселях, но после различных операций, связанных с корректировкой изображения, особенно при повороте, появятся отличия, которые легко компенсировать в меню "Изображение-Изменить размер изображения".

Последний этап — сканирование обложек, делается в цвете при 300dpi, не обращая внимания на размер файла, при кодировании в djvu сжатие все равно будет значительным. Перед конвертированием еще раз проверьте все файлы в Ирфане (строчка внизу, слева) на идентичность размера и глубину цвета. Удобнее цветные обложки конвертировать в djvu отдельно и им нужны другие установки кодера, потом вставьте их после последней страницы с номером, тогда нумерация страниц в журнале не пострадает.

При качественном сканировании никакой обрезки и чистки не требуется, можно запускать программу кодирования в djvu, для примера выбран Document Express Editor 6.0.1 Build 1259, в других версиях отличия незначительны.

Запускаем программу, щелкаем на меню "File" — "Open", в меню "Тип файлов" выбираем tif, если сканирование было именно в этом формате и открываем первый файл. Он будет отображен в главном окне, а также, в виде эскиза слева, щелкаем по эскизу правой мышкой и выбираем пункт "Insert Page(s) After" — Добавить страницу (страницы) после открытой.

В меню опять выбираем тип файлов tif, выделяем все файлы, которые нужно добавить после первой страницы (кроме первого, он уже открыт), начиная с последнего, это особенность всех djvu кодеров. Ждем их открытия, если файлов много, то это занимает некоторое время, в результате они появляются в виде колонки эскизов слева.

В меню "File" выбираем пункт "Save As… — Сохранить как…" или щелкаем по иконке на панели с аналогичной функцией. Появляется диалог сохранения и кодирования djvu файла:

Выбираем папку и имя файла для сохранения, тип файла djvu "Bundle/Indirect — Одним файлом/В виде отдельных страниц".

В пункте "Profile — Профиль" нужно установить тип кодирования изображения, для всех типов изображений подходит "Normal". Если затрудняетесь с выбором подходящего профиля, то либо предварительно попробуйте их по очереди на одном файле, либо сразу выбирайте "Normal", результаты будут вполне удовлетворительные. Для получения черно-белых изображений выбирается "Bitonal". В пункте DPI установите разрешение, с которым сканировали, не стоит выбирать его больше или меньше, это не имеет смысла. Затем устанавливаем параметр "Text Quality", от которого зависит качество текста на страницах файла djvu:

Обычно хорошие результаты дает aggressive, но если встречается мелкий текст или важно не потерять качество текста, то выбирается lossless — без потерь, хотя размер конечного файла будет несколько больше. Минимальные размеры файла с текстом дает lossy, но при невысоком разрешении и мелком тексте очень высока вероятность появления ошибок, когда путаются буквы "и" и "н", "а" и "в", "з" и "э" и т. д. Поэтому данный режим следует использовать с большой осторожностью. Если есть сомнения и затруднения в выборе, используйте lossless — лучше увеличенный размер файла, чем масса ошибок, которые потом не исправить.

Отметка в пункте "OCR" позволяет получить текстовый слой в djvu файле. Параметры OCR выбираются через меню "Edit-Preferences", закладка "OCR":

Здесь можно выбрать язык распознавания и уровень координат привязки word — слова или char — символы. К сожалению, возможность выбрать несколько языков распознавания заблокирована, а сам движок OCR оставляет желать лучшего по качеству распознавания текста. Применение программы FineReader дает неизмеримо лучшие результаты распознавания текста, но рассмотрение работы с ним и необходимых для этого утилит, выходит за рамки данной статьи[12].

Когда все параметры установлены, нажимается кнопка "Сохранить" и через некоторое время получаем файл djvu. Типичной ошибкой при конвертировании в djvu является излишнее количество цветов, поэтому не забывайте проверить, что получено в результате кодирования. Сделать это очень просто: щелкните правой мышью на изображении в программе просмотра djvu файла и выберите пункт со свойствами страницы. Если у вроде бы черно-белой страницы вы увидите приблизительно такие строчки:

DJVU Image (2355x3262, 300 dpi) version 25:

0,0 Kb 'INFO' Page information.

0,0 Kb 'INCL' Indirection chunk (020009_0001.djbz).

11,2 Kb 'Sjbz' JB2 foreground mask (2355x3262, 300 dpi)

0,0 Kb 'FGbz' JB2 foreground colors (1 color, 4084 ccs).

0,6 Kb 'BG44' IW44 background (785x1088, 100 dpi).

0,1 Kb 'BG44' IW44 background (part 2, 100 dpi).

0,0 Kb 'BG44' IW44 background (part 3, 100 dpi).

0,2 Kb 'BG44' IW44 background (part 4, 100 dpi).

Поделиться:
Популярные книги

Измена. Не прощу

Леманн Анастасия
1. Измены
Любовные романы:
современные любовные романы
4.00
рейтинг книги
Измена. Не прощу

Неудержимый. Книга II

Боярский Андрей
2. Неудержимый
Фантастика:
городское фэнтези
попаданцы
5.00
рейтинг книги
Неудержимый. Книга II

Возвышение Меркурия. Книга 16

Кронос Александр
16. Меркурий
Фантастика:
попаданцы
аниме
5.00
рейтинг книги
Возвышение Меркурия. Книга 16

Измена. Осколки чувств

Верди Алиса
2. Измены
Любовные романы:
современные любовные романы
5.00
рейтинг книги
Измена. Осколки чувств

Отборная бабушка

Мягкова Нинель
Фантастика:
фэнтези
юмористическая фантастика
7.74
рейтинг книги
Отборная бабушка

Измена. Ребёнок от бывшего мужа

Стар Дана
Любовные романы:
современные любовные романы
5.00
рейтинг книги
Измена. Ребёнок от бывшего мужа

Неверный. Свободный роман

Лакс Айрин
Любовные романы:
современные любовные романы
эро литература
5.00
рейтинг книги
Неверный. Свободный роман

Бывшие. Война в академии магии

Берг Александра
2. Измены
Любовные романы:
любовно-фантастические романы
7.00
рейтинг книги
Бывшие. Война в академии магии

Ты нас предал

Безрукова Елена
1. Измены. Кантемировы
Любовные романы:
современные любовные романы
5.00
рейтинг книги
Ты нас предал

В теле пацана 6

Павлов Игорь Васильевич
6. Великое плато Вита
Фантастика:
фэнтези
попаданцы
5.00
рейтинг книги
В теле пацана 6

Вернуть невесту. Ловушка для попаданки 2

Ардова Алиса
2. Вернуть невесту
Любовные романы:
любовно-фантастические романы
7.88
рейтинг книги
Вернуть невесту. Ловушка для попаданки 2

Его маленькая большая женщина

Резник Юлия
Любовные романы:
современные любовные романы
эро литература
8.78
рейтинг книги
Его маленькая большая женщина

Инферно

Кретов Владимир Владимирович
2. Легенда
Фантастика:
фэнтези
8.57
рейтинг книги
Инферно

Золушка вне правил

Шах Ольга
Любовные романы:
любовно-фантастические романы
6.83
рейтинг книги
Золушка вне правил