The Ebook. Книга об электронных книгах
Шрифт:
По статистике — 16 % читателей использует только формат PDF. Трудно представить, но именно такое количество читателей в какой-то промежуток времени ограничивает себя чтением специфической литературы. Статистика увеличится ещё более серьёзно, если представить, какая литература читается в этом формате. Найти журнал в формате PDF гораздо проще, чем в FB2 или EPUB. Но те, кто покупает журналы и делает это регулярно, чаще читают в узкоспециализированном формате, который даёт представление не только для графических элементов, но и может содержать скрытый текст. Подобный ZINIO формат используется для специальной программы.
Основное отличие FB2 от других
FB2 создан на основе XML для разметки текста. Разработчик формата придумал простой ход — исследовал строение книги и воспроизвёл его в тегах. Со временем часть тегов оказалась ненужной, а другая часть, наоборот, была добавлена.
Если посмотреть книгу в формате FB2 с помощью текстового редактора, то, можно будет увидеть содержание обычного TXT файла, где абзац окружён тегами. Также — глава, название книги, формулы, таблицы и так далее.
Можно считать, что EPUB — это некий, более коммерческий аналог FB2, но, по сути, читателю должно быть безразлично — какой из этих форматов использовать. Главное — это доступность книг. И очень важно, чтобы формат поддерживала программа или устройство.
Форматы книг делятся на три типа: «простой», «текстовый», «графический».
Ярким представителем «простого» типа можно назвать формат TXT. Ничего кроме текста и маркера «конец строки» (раньше, когда ещё знали, что такое «пишущая машинка», говорили: «перевод каретки»). TXT может быть в одной из общепринятых кодировок. Современное представление о форматах рекомендует использование кодировки unicode (UTF8) для поддержки множества языков и совместимости между платформами.
«Текстовый» тип, к которым относятся FB2 и EPUB, содержит в себе не только текст, но и оформительскую разметку, графические иллюстрации, ссылки и так далее. В таких форматах выделяется жирный и наклонный текст, таблицы и стихи, сноски и заголовки. Основное преимущество — возможность масштабировать текст по размеру, изменять расстояние между строками или регулировать «текстовое поле», то есть расстояние от текста до края экрана. Можно сохранять типографику даже при разбиении страницы на несколько колонок. Лишь бы это поддерживал интерпретатор текста.
«Графический» формат проще всего представить в виде «факсимильного» издания, когда с полученным текстом ничего уже сделать нельзя, кроме как увеличить фрагмент на экране. Считайте, что каждый лист это отдельная фотография, отпечаток или лист из факса. И в данном случае неважно, содержит ли PDF текст, а не его графическое изображение единой страницей. Функция Reflow позволяет масштабировать текст, если он есть внутри файла, но в ущерб вёрстки. Если текст верстался в отдельных окнах или колонках, то ничего хорошего при Reflow не получится. Текст смешается в нечитаемое пятно. В данном случае увеличивать лучше с помощью «лупы» для изменения размера изображения всего листа, а не отдельного текста.
Основным и распространённым «обманом» при выборе устройства с множеством поддерживаемых форматов — является игнорирование разметки. В списке характеристик может быть перечислено огромное количество форматов, но не факт, что они поддерживаются на должном уровне. В данном случае существует три градации качества: полное или частичное игнорирование тегов разметки, а также наоборот, полная поддержка разметки текста. Бывает так, что в характеристиках значится формат FB2, а на экране вместо него «простой текст» без разметки. Был FB2, а стал TXT. Интерпретатор удалил теги, тем самым облегчив себе задачу по выводу текста на экран. Это наиболее распространённый способ игнорирования тегов, разница только в том, сколько и какие теги игнорируются.
Сказанное не относится к сервисным функциям устройств, они везде разные. Их может быть много, ради увеличения комфорта чтения, а может быть мало, ради использования слабого процессора или за счёт элементарной лени разработчика.
Также, не стоит путать сложный интерфейс с богатством функций и настроек. Есть устройства, которые визуально отличаются интерфейсом, но делают одно и то же. Сложный интерфейс не говорит о том, что устройство может гораздо лучше, чем устройство с простым и понятным интерфейсом. Разработчики умышленно могут создавать сложные интерфейсы, чтобы вводить в заблуждение. Проще всего определять возможности устройства с помощью подсчёта количества функций: делает ли типографскую разметку текста, можно ли изменить текстовое окно, или расстояние между строк и так далее.
При выборе устройства нужно заранее предполагать, какой текст будет читаться и из какого источника будет доставляться контент. Если файл книги подготовлен профессионалом, то для чтения художественной литературы достаточно одного из форматов: FB2 или EPUB. И неважно, какого из них. Эти форматы ничем особым не отличаются от AZW (MOBI), который используется в Kindle. Особой разницы для потребителя в форматах нет, кроме распространённости их на локальном рынке.
Для более сложно-оформленного текста, такого, как научная или техническая литература, европейским читателям лучше использовать PDF или DJVU. Не потому, что эти форматы лучше, а потому, что именно в них обычно распространяются в Интернет. Разница в том, что иностранные издательства оформляют такие книги в «текстовом» формате, а наши читатели используют факсимильные копии, то есть, кем-то отсканированные постранично, как было в бумажном оригинале.
DJVU отличается тем, что в его составе отдельные листы страниц, упакованные в единый блок. Сканируется каждая страница книги в высоком разрешении и с последующим сжатием для компактности общего размера файла. Далее, страницы собираются в едином блоке. Подобный трюк можно сделать и в формате PDF, но DJVU прижился лучше. Оглавлением, индексом и прочими особенностями графических форматов, забивать голову не стоит. В большинстве случаев — это дешёвый и быстрый вариант копии бумажной книги.
Также работает CBZ и CBR — форматы для комиксов. Каждая отдельная страница в одном из графических форматов, например JPG, именуется по правилу «трёх цифр» — 001, 002, 003, 004 и так далее. Все отсканированные файлы упаковываются архиватором ZIP или RAR. Именно последняя буква в названии формата Z или R говорит о том, каким архиватором упакованы страницы.
Из сложного «текстового» формата почти всегда можно сделать «простой текст». В истории была только одна программа — BookDesigner, которая из TXT могла интуитивно создать сложную разметку текста. Она пыталась определить название главы, окончание абзаца, преобразование в наклонный или жирный текст. Это делалось не по воле и задумке автора книги, а как бы предполагалось программой, что так может быть, раз в тексте написано: «Глава 1» или абзац начинается с нескольких звёздочек: «***» или «* * *», если со знака «*», «—» или «» и абзацы повторяются — следовательно, используется перечисление неких характеристик или условий.