Создание электронных книг в формате FictionBook 2.1: практическое руководство
Шрифт:
Процесс кодирования преобразует 3 входных символа в виде 24-битной группы, обрабатывая их слева направо. Эти группы затем рассматриваются как 4 соединенные 6-битные группы, каждая из которых транслируется в одиночный символ алфавита base64. При кодировании base64, входной поток байтов должен быть упорядочен старшими битами вперед.
Каждая 6-битная группа используется как индекс для массива 64-х печатных символов. Символ, на который указывает значение индекса, помещается в выходную строку. Эти символы выбраны так, чтобы быть универсально представимыми и исключают символы, имеющие
Таблица: Алфавит Base64
Выходной поток (закодированные байты) должен иметь длину строк не более 76 символов. Все признаки перевода строки и другие символы, отсутствующие в таблице 1, должны быть проигнорированы декодером base64. Среди данных в Base64 символы, не перечисленные в табл. 1, переводы строки и т.п. должны говорить об ошибке передачи данных, и, соответственно, почтовая программа должна оповестить пользователя о ней.
Если в хвосте потока кодируемых данных осталось меньше, чем 24 бита, справа добавляются нулевые биты до образования целого числа 6-битных групп. А до конца 24-битной группы остается от 0 до 3-х недостающих 6-битных групп, вместо каждой из которых ставится символ-заполнитель «=». Поскольку весь входной поток представляет собой целое число 8-битных групп (т.е., просто байтных значений), то возможны лишь следующие случаи:
(1) входной поток как раз оканчивается 24-битной группой. В таком случае, выходной поток будет оканчиваться четырьмя символами Base64 без символа «=»;
(2) хвост входного потока имеет длину 8 бит. Тогда в конце выходного кода будут два символа Base64, с добавлением двух символов «=»;
(3) хвост входного потока имеет длину 16 бит. Тогда в конце выходного будут стоять три символа Base64 и один символ «=».
Т.к. символ «=» является хвостовым заполнителем, его появление в теле письма может означать только то, что конец данных достигнут. Но такой гарантии нет, если число переданных битов кратно 24.
Любые бессмысленные последовательности в коде Base64 вроде «=====» должны быть игнорированы.
Основано на:
Спецификация RFC 1521 «MIME — Multipurpose Internet Mail Extensions. Part one.»
Приложение Ж
Описание стандарта ISBN
Международное агентство ISBN присваивает идентификатор группы, который обозначает либо группу стран (например, 0 — для англоязычных стран: Великобритании, США, Австралии, Канады, Ирландии и других), либо отдельную страну (например, 933 — для ШР). Количество цифр в идентификаторе группы зависит от годового объема книжной продукции страны.
Идентификаторы группы устанавливается международным агентством ISBN в следующих диапазонах чисел:
0–7
60–94
950–997
9980–9989
99900–99999
<...>
1.1. Международный стандартный номер книги — универсальный идентификационный код, проставляемый на книгах и брошюрах.
1.2. В соответствии с ГОСТ 16447-70 «Издания. Термины и определения основных видов» книга — непериодическое текстовое издание объемом свыше 48 страниц, брошюра — непериодическое текстовое издание объемом свыше четырех, но не более 48 страниц.
<...>
3.1. Международный стандартный номер книги состоит из аббревиатуры ISBN (независимо от языка издания книги или брошюры), и 10 цифр.
3.2. Дня обозначения цифровой части ISBN применяется арабские цифры от 0 до 9. Последняя цифра ISBN - контрольная — может быть римской цифрой X, используемой для обозначения числа 10.
3.3. Цифровая часть ISBN состоит из четырех групп цифр, содержащих различное количество цифровых знаков, отделяемых друг от друга дефисом.
Цифровая часть отделяется от аббревиатуры ISBN пробелом.
3.4. Четыре группы цифр ISBN располагаются в следующей последовательности:
1) идентификатор группы;
2) идентификатор издательства;
3) порядковый идентификатор книги;
4) контрольная цифра.
Hапример: ISBN 5-05-000746-1, где
5 — идентификатор СССР;
06 — идентификатор издательства «Радуга»;
000746 — порядковый идентификатор книги;
1 — контрольная цифра.
3.5. Идентификатор группы устанавливается Международным агентством ISBN.
СССР присвоен однозначный идентификатор 5.
3.6. Идентификатор издательства присваивается Всесоюзной книжной палатой.
Идентификатор издательства вместе с идентификатором группы служит для идентификации издательства на международном уровне.
3.6.1. Идентификаторы издательства могут быть индивидуальными и собирательными.
Советским издательствам присвоены только индивидуальные идентификаторы.
3.6.2. Идентификатор издательства может содержать различное количество цифровых знаков (от двух до семи) в зависимости от объма выпускаемой книжной продукции.
Издательствам с большим объемом книжной продукции присваивается идентификатор с наименьшим количеством цифровых знаков. Издательством с небольшим объемом книжной продукции присваивается идентификатор с большим количеством цифровых знаков. Идентификаторы издательств устанавливается в пределах следующих диапазонов:
двузначные идентификаторы 00 – 19
трехзначные 200 – 609
четырехзначные 7000 – 0499
пятизначные 85000 – 09999
шестизначные 900000 – 949999
семизначные 9500000 – 9997999
3.7. Порядковый идентификатор книги служит для идентификации конкретного издания.
Порядковый идентификатор книги присваивается издательством.
3.7.1. Количество цифровых знаков порядкового идентификатора книги зависит от идентификатора издательства. Порядковый ISBN книги может содержать от одной до шести цифр. с таким расчетом, чтобы вместе с идентификатором группы, издательства и контрольной цифрой ISBN насчитывал десять цифр. Hапример:
ISBN 5-02-000000-0 («Hаука»)
ISBN 5-229-000000-0 («Металлургия»)