The Ebook. Книга об электронных книгах
Шрифт:
Основные предназначения форматов можно представить по типу:
• Просмотр — назначение форматов при просмотре подготовленного контента сводится к определению платформы для использования. Определяется электронный носитель или программное обеспечение для любого или специализированного устройства. Разница только в том, что создающий контент оператор подозревает конкретные ограничения при считывании формата.
• Возможности — определяются объёмом документа и разработчиком.
• Предназначение — предполагается потребителем и подразумевается разработчиком, который в свою очередь определяет степень открытости формата.
• Создание документа — определяется
• Редактирование — определяются не только инструменты и программы для внесения исправлений, но и сама возможность, как часть предназначения формата. Для некоторых форматов возможности редактирования ограничены и могут применяться не для замены текста, а для редактирования графических образов и иллюстраций внутри формата.
Из указанных типов — все могут иметь ограничения в зависимости от технической реализации формата, которое сводится к защите данных (англ. «DRM» — технические средства защиты) или к сжатию определённых типов данных:
• Сжатие внедрения или связывания шрифтов и мультимедиа.
• Отдельное сжатие растровых изображений и текста.
• Сжатие самих «алгоритмов сжатия» растровых изображений.
• Использование встроенного механизма сжатия для всего документа и защита данных.
Назначение формата зависит от типа используемых данных:
• Векторные
• Графические
• Текстовые
• Мультимедиа
Каждый тип данных поддерживает цветовую модель или их гибрид: RGB, CMYK, Grayscale, Lab, Duotone, Bitmap.
В формат могут быть встроены или описаны для использования предполагаемые шрифты. Обычный и типичный набор: Times, Courier, Helvetica, Symbol, Zapf Dingbats. Можно описать шрифты по типам, а не конкретно по имени: рубленый, с засечками и символьный.
Для сокращения ошибок, но ограничения масштабирования, некоторый текст в формате может быть заменён на другой тип. Например, математические формулы описанные текстом с использованием символьных шрифтов могут быть заменены иллюстрацией. Таким образом, текст заменяется графическим типом данных. Такой подход изменяет набор инструментов для дальнейшего редактирования, и масштабирование текста может быть непропорциональным по отношению к иллюстрации.
Графические форматы могут масштабироваться на экране пропорционально изображению, но если страница сделана полностью в графическом виде, то масштабирование может быть увеличено за видимые границы экрана, тем самым используется не увеличение масштаба содержимого, а фрагментация страницы в другом масштабе. Графический текст поддерживает жёстко заданные границы полей и страниц, в отличие от текстовых форматов, которые могут увеличивать общее количество страниц в документе в зависимости от размера начертания шрифта.
В зависимости от формата данных внутри структуры документа некоторые форматы лучше использовать для определённого контента:
• TXT — используется только для текста без разметки, типографикой в данном случае будет заниматься программное обеспечение.
• EPUB, FB2 и MOBI — содержат в себе смешанный тип данных, поэтому подходят для масштабирования текста во время чтения с сохранением заложенной разметки. Типографикой будет заниматься программное обеспечение, но оно заранее знает выделение фрагментов текста. Переносы слов обычно не описываются форматом, и этим точно будет заниматься только программное обеспечение по запрограммированному алгоритму естественного
• PDF — следует описать отдельно, так как формат хоть и можно отнести к графическому типу, из-за жёсткой разметки текста и иллюстраций, но при наличии текста внутри структуры возможно масштабирование с потерей разметки. Класс TextFlow описывает содержимое текста и внутри есть описание параграфа, ссылок, графики и разделителей.
• DJVU — графический формат, хотя может содержать в себе дополнительные элементы с текстовыми данными. Популярность формата привела к тому, что внутри документа фактически находятся только графические образы страниц и ничего более. С подобной задачей справится любой контейнер с набором иллюстраций в строгой последовательности страниц.
• CBZ и CBR — это как раз наглядный пример контейнера с графическими данными, где название файла соответствует номеру страницы (например, 001, 002, 003 и так далее). В качестве контейнера используются популярные архиваторы ZIP или RAR (последняя буква в обозначении формата).
Таким образом, форматы определяют тип используемых данных и по ним можно предположить предназначение форматов.
EPUB, FB2 и MOBI — современные форматы для чтения литературы в текстовом виде. Особой разницы для потребителей контента в них не заложено. Они в равной степени могут почти одно и то же. Изменение размера шрифта позволяет адаптировать текст под размер экрана носителя с учётом предпочтений конечного пользователя. Для профессионалов это форматы, в которых набор текста может быть сложен для табличных и формульных данных. Это трудоёмко и требует особого внимания и терпения. Часто эти типы данных конвертируют или сохраняют в графическом формате, чтобы сократить время набора и ограничить количество вероятных ошибок при сборке итогового документа. Таким образом, внутри масштабируемого формата могут быть данные, которые не подлежат масштабированию с переносом строк.
Графические форматы, к которым сейчас можно отнести почти всё, что в большей степени содержит факсимильный образ страницы, как правило, пригодны для печати. Удобство чтения форматов зависит от размера экрана электронного носителя. От комфорта — не только при увеличении или уменьшении фрагмента страницы, но и от скорости управления документом и этими функциями.
Форматы для комиксов CBZ и CBR хоть и являются полностью графическими, но лучшие существующие программы автоматически определяют границы кадров и могут по отдельности увеличивать на экране только их зоны. Не всегда возможно комфортное прочтение текста в «баблах», но это в основном в тех комиксах, которые создавались без учёта цифровой эпохи и были рассчитаны для чтения только в оригинальном размере печатной страницы.
Такие форматы как DOC или RTF годятся для последующего редактирования, но это ещё не значит, что программное обеспечение для чтения поддерживает функции не только полнофункционального редактора, но и даже самых простых возможностей — замены отдельных букв, слов, предложений и так далее. Из этого следует сделать вывод таким образом, что не существует универсально удобных инструментов для чтения и редактирования. В некоторых случаях функции доступны, но не обеспечивают должного комфорта.
Мнение об «универсальности форматов» — это тоже часть предназначения, но не их носителей. Например, PDF может быть удобен как формат с возможностью последующей распечатки на принтере или для чтения на большом экране компьютера, планшета, но плохо совместим с медлительными компактными устройствами, на которых удобно читать, но только в текстовом формате.