Linux
Шрифт:
openvt Утилита, позволяющая создавать текстовую консоль (до 64). Можно использовать в том случае, если окажется недостаточно стандартных шести виртуальных консолей. Используется совместно с указанием опций и выполняемой команды, для которой создается консоль.
perl PERL – это сокращение от Practical Extraction and Report Language, интерпретируемого языка программирования, обычно применяемого для написания системными администраторами различных скриптов, призванных автоматизировать и упростить ежедневные операции администратора. Так же очень широко используется при создании CGI-скриптов для Web-сайтов.
printenv Эта команда выводит значения переменных окружения. Если в командной строке указана переменная, то выводится ее значение, в противном случае выводятся значения всех переменных окружения.
reset Эта команда выполняет начальную инициализацию терминала.
resizecons Утилита позволяет изменить разрешение текстовой консоли (стандартное – 80 символов в строке, 25 строк на экране) в достаточно большом диапазоне.
startx
Команда startx предназначена для запуска X Window
strings Команда strings выполняет поиск текстовых строк в файле. По умолчанию выводятся только строки, длина которых составляет не менее 4 символов.
strip Команда strip удаляет таблицы символов из объектных файлов. Список объектных файлов может включать библиотеки, но должен быть указан по крайней мере один объектный файл. Используется для уменьшения размеров исполняемых файлов и библиотек.
subst
Команда subst производит в файлах указанные подстановки. Обычно она используется для настройки программного обеспечения под конкретную систему. Содержимое каждого из указанных файлов изменяется в соответствии с содержимым файла подстановок.
Файл подстановок содержит по одной подстановке на строке. Строка подстановки состоит из двух полей, разделенных одним или несколькими символами табуляции. Первое поле строки представляет подстановку, второе – значение. Ни одно из полей не должно содержать символа. Строки, начинающиеся с #, считаются комментариями и игнорируются.su Команда su запускает интерпретатор командной строки с правами указанного пользователя. Обычно используется в административных целях для временного входа под именем пользователя root. В качестве запускаемого интерпретатора командной строки используется интерпретатор командной строки, заданный в файле /etc/passwd для указанного пользователя. Если указанный пользователь имеет пароль, то команда su запросит его.
true Эта команда возвращает код возврата, равный 0, что означает успешное выполнение.
yes
Эта команда непрерывно выводит указанную строку, разделяя две выводимые строки символом новой строки.
Если строка не указана, то выводится символ у. Эта команда обычно используется для того, чтобы передать ее стандартный вывод программе, на все вопросы которой следует ответить утвердительно.Сссылки
• Соответствующие страницы руководства man.
• www.linuxdocs.org – разнообразная документация, включая HOWTO.
• Соответствующие HOWTO (см. гл. 13):
– iptables-HOWTO;
– NAT-HOWTO.
Часть V Настройка и сервисы Linux
Глава 15 Локализация
Еще лет десять назад нормальным явлением в компьютерном мире было почти полное отсутствие русского, украинского, белорусского и тому подобных языков в большинстве операционных сред и программ. Знание пользователем английского технического (правильнее сказать – «компьютерного») языка считалось само собой разумеющимся. Такой порядок вещей обуславливался множеством факторов, и в первую очередь тем, что популярные операционные системы производились американскими компаниями и были рассчитаны на англоговорящую аудиторию. С той поры компьютер стал массовым явлением, а наш компьютерный пользователь в большинстве своем английский язык знает либо очень плохо, либо совсем не знает.
Замечание
Чтобы постоянно не перечислять здесь множество основанных на кириллице языков, в дальнейшем мы станем упоминать в этом контексте лишь русский язык, но иметь в виду будем, разумеется, и все остальные.
Большинство коммерческих программ и операционных систем в той или иной мере русифицированы. Что же в этом плане может предложить Linux? Как известно, «спасение утопающих – дело рук самих утопающих», и поскольку Linux операционная система некоммерческая – локализация ее выполняется самими пользователями. В последние год-полтора усилиями наших русскоговорящих разработчиков дистрибутивов, а также фирмы Red Hat и многочисленных энтузиастов, большинство коробочных иностранных дистрибутивов (не говоря уже о русских и украинских) непосредственно после инсталляции могут корректно работать с кириллицей, вплоть до того, что на русский язык переведен и интерфейс многих программ.
Тем не менее, для администратора необходимо знать, каким образом можно локализировать операционную систему Linux.
Поскольку Linux-сообщество велико и разнородно, а программы портировались с различных операционных систем, привести их к одному знаменателю для нормальной локализации, к сожалению, весьма затруднительно.
Однако современные тенденции таковы, что в мире Linux назревает осознание необходимости принятия стандартов на ключевые технологии, в частности, написания программ, с минимальными усилиями локализуемых. Но об этом позже.
Рис. 15.1. GNOME, говорящий по-русски
А сейчас определим, что нам прежде всего потребуется от хорошо локализованной системы:
• корректно настроенная текстовая консоль (правильные шрифты, ввод и вывод кириллицы);
• корректно настроенная система X Window;
• правильный вывод кириллицы на принтер;
• настроенная на кириллицу система проверки правописания;
• локализованные основные программы – редакторы, офисные пакеты, словари и т. п.
Теоретическая часть
Стандарты кодировки
Как известно, символ как минимальный элемент алфавита, и представление этого символа в компьютере (кодировка) – две разные вещи.
Кодировкой называется совокупность уникальных символов, которые система способна распознать как самостоятельную сущность.
Поскольку первоначально компьютеры были разработаны за рубежом (Великобритания и США) и не предназначались для экспорта, производители не озаботились поддержкой языков, отличных от английского. Со временем это вызвало определенные проблемы, однако решение их осуществлялось хаотично и без учета перспектив дальнейшего развития программ и аппаратуры. В результате русскоязычное компьютерное сообщество получило несколько различных кодировок, в той или иной степени учитывающих национальную специфику.
Стандарт ASCII
Наиболее популярной кодировкой была (и фактически
Стандарт ASCII, иногда называемый 7-битный ASCII, включает в себя 128 уникальных символов. Они подразделяются на символы, которые ASCII определяет как печатаемые символы, и на символы управления, большая часть которых использовалась в старых протоколах связи. Каждому элементу набора соответствует целочисленный символьный код от 0 до 127.
Со временем 7-битный стандарт ASCII был расширен до 8-битного ASCII (расширенный ASCII). Этот стандарт подразумевает наличие 256 символов, которые соответствуют кодам от 0 до 255. Первая часть таблицы – от 0 до 127 не претерпела по сравнению с предыдущим стандартом никаких изменений, а во второй половине таблицы пусто. Дело в том, что 8-битный стандарт ASCII не определяет содержание второй половины таблицы кодировки. В этих целях Международная Организация по Стандартизации (ISO) выпустила серию стандартов (известных как семейство ISO 8859-х), определяющих кодировку второй половины таблицы для различных языков. Нас как пользователей кириллицы интересуют следующие кодовые страницы:
• 8859-0 – новый европейский стандарт (Latin 0);
• 8859-1 – Европа, Латинская Америка (Latin 1);
• 8859-2 – Восточная Европа.
• 8859-5 – кириллица.
В кодовой странице 8859-1 (Latin 1) старшая половина таблицы определяет различные символы, которые не входят в английский алфавит, но присутствуют в различных европейских языках. Соответственно, в остальных кодировках в старшей половине таблицы находятся специфические национальные символы, входящие в алфавит указанного региона.
Есть еще одна реализация расширенного ASCII – кодовая страница IBM. Эта кодировка в старшей половине содержит псевдографические символы.
Казалось бы, вполне достаточный набор стандартов. Однако есть несколько отрицательных моментов:
• ограничение набора модифицируемых символов (128);
• невозможность использования в одном чисто текстовом документе нескольких кодировок.
Альтернативная кодировка (CP866)
Альтернативная кодировка (СР866) – это кодовая страница IBM, где все специфические европейские символы были заменены на буквы из кириллицы, оставив нетронутыми псевдографические символы.
Кодировка Microsoft CP1251
Кодовая страница Microsoft CP 1251 – это попытка Microsoft облегчить труд программисту. Используется для кодировки кириллицы в Windows. Устраняет проблему с сортировкой по алфавиту, связанную с тем, что в странице СР866 буквы русского алфавита располагались не подряд.
Стандарт КОИ8
Стандарт был разработан достаточно давно, когда во всю использовалась 7-битная кодировка символов ASCII. Разработчики КОИ8 поместили символы русской кириллицы в верхней части расширенной таблицы ASCII таким образом, чтобы позиции кириллических символов соответствовали их фонетическим аналогам в английском алфавите в нижней части таблицы. Так, если в тексте, хранящемся в кодировке КОИ8, убрать старший (восьмой) бит каждого символа, то получится текст, написанный английскими символами в русской транскрипции. Например, предложение «Мама мыла раму» после удаления старшего бита будет выглядеть так: «Mama myla ramu».
Существует несколько реализаций стандарта КОИ8, в частности, KOI8-R – для русского языка, KOI8-U – для украинского.
Стандарт RFC 1489 Registration of a Cyrillic Character Set, созданный Андреем Черновым, регламентирует использование KOI8-R для представления русскоязычных документов в Интернете, где KOI8-R давно уже стал фактическим стандартом для русской кириллицы.
Unicode
Unicode – частичная реализация стандарта ISO 10646, в котором первые 256 символов соответствуют кодировке Latin-1 (ISO 8859-1). Основная идея этого стандарта – кодирование символа с использованием переменного количества байтов (до 8). На данном этапе используется двухбайтное кодирование символа, дающее возможность определить 65 535 символов. В настоящее время позиции зарезервированы за буквами практически всех известных алфавитов, включая древнеегипетские иероглифы, благодаря чему можно, используя всего один шрифт, писать одновременно на русском и греческом, английском и иврите и делать еще вставки на японском. Используется в Windows 98 и более поздних версиях. В UNIX-системах поддержка Unicode реализована частично.
Украинский язык
Специфика локализации для Украины состоит в том, что зачастую нужно использовать и украинский, и русский языки одновременно (большая часть жителей городов Центральной, Южной и Восточной Украины – русскоговорящие, а официальный язык – украинский).
Кириллизация консоли
В большинстве современных дистрибутивов кириллизация консоли происходит по запросу при инсталляции. Однако необходимо рассмотреть способы кириллизации текстового режима как фундамента, на котором держится локализация операционной системы в целом.
Консольный драйвер
Для настройки консоли можно воспользоваться пакетами console-tools, Cyrillic console-tools (модификация console-tools с расширенным набором шрифтов и дополнительными свойствами) или kbd. В дистрибутиве Red Hat Linux в ранних версиях применялся пакет kbd, в более поздних (начиная с версии 6) – console-tools. Чтобы не упустить особенностей, рассмотрим использование обоих пакетов.
Схема функционирования консольного драйвераДля понимания дальнейших действий необходимо четко представлять, как функционирует консольный драйвер.
В Linux применяются две таблицы символов – таблица символов приложения (Application Charset Map, ACM) и таблица экранных шрифтов (Screen Font Map, SFM).
Когда программа предлагает консольному драйверу вывести на экран символ, имеющий код, например А, то консольный драйвер прежде ищет код А в таблице символов приложения. Из нее он узнает, какой код В согласно кодировке Unicode соответствует коду А. Далее консольный драйвер ищет код В в таблице экранных шрифтов. Из нее он узнает, какой символ активного шрифта имеет код В, и выводит его на экран. А используемую операционной системой кодировку посредством таблицы символов приложения определяет пользователь.
Аппаратные ограничения видеокарт VGA не позволяют использовать в текстовом режиме шрифты, имеющие более 512 символов. Поэтому иногда консольный драйвер не может найти код В в таблице экранных шрифтов. В этом случае используется так называемая fallback-таблица. Она определяет для кода В возможные его аппроксимации Bl, В2 и т. д. Например, если В является кодом символа "левая двойная угловая кавычка", то, возможно, В1 будет кодом символа "левая одинарная угловая кавычка", а В2 будет просто кодом символа <.
Настройка поддержки кириллицы с помощью пакетов console-tools и kbd состоит из:
• настройки экранного шрифта и таблицы экранных шрифтов. Это делается с помощью программы consolechars (для console-tools) или setfont и mapscrn (для kbd);
• настройки таблицы символов приложения и fallback-таблицы;
• загрузки соответствующей раскладки клавиатуры с помощью программы load keys.
Файлы шрифтов обычно размещаются в каталогах /usr/share/consolefonts или /usr/lib/kbd/consolefonts, символьные таблицы в каталоге /usr/share/consoletrans, клавиатурные раскладки в /usr/share/keymap/i386/qwerty.
console-tools Если на компьютере установлен пакет console-tools, то необходимо выполнить следующие действия: