Скорость может быть достигнута в результате использования специальных инструкций «блочного сравнения памяти», которые поддерживают многие архитектуры, или в результате сравнения единиц, превышающих байты. (Эта последняя операция коварна, и лучше оставить ее автору библиотеки.)
По этим причинам всегда следует использовать вашу библиотечную версию
memcmp
вместо прокручивания своей собственной. Велика вероятность, что автор библиотеки знает машину лучше вас
12.2.4. Поиск байта с данным значением:
memchr
Функция
memchr
сходна
с функцией
strchr
: она возвращает местоположение определенного значения внутри произвольного буфера. Как и в случае
memcmp
против
strcmp
, основной причиной для использования
memchr
является использование произвольных двоичных данных.
GNU
wc
использует
memchr
при подсчете лишь строк и байтов [124] , и это позволяет
wс
быть быстрой. Из
wc.c
в GNU Coreutils:
124
См. wс(1).
wc
подсчитывает строки, слова и символы — Примеч. автора.
257 else if (!count_chars && !count_complicated)
258 {
259 /* Использует отдельный цикл при подсчете лишь строк или строк и байтов -
260 но не символов или слов. */
261 while ((bytes_read = safe_read(fd, buf, BUFFER_SIZE)) > 0)
Внешний цикл (строки 261–278) читает блоки данных из входного файла. Внутренний цикл (строки 272–276) использует
memchr
для поиска и подсчета символов конца строки. Сложное выражение '
(buf + bytes_read) - р
' сводится к числу оставшихся байтов между текущим значением p и концом буфера.
Комментарии в строках 259–260 нуждаются в некотором объяснении. Вкратце, современные системы могут использовать символы, занимающие более одного байта в памяти и на диске. (Это несколько более подробно обсуждается в разделе 13.4 «Не могли бы вы произнести это для меня по буквам?».) Таким образом,
wc
должна использовать другой код, если она различает байты и символы: этот код имеет дело со случаем подсчета байтов.
12.3. Временные файлы
Временный файл является в точности тем, что звучит в его названии: файл,
в котором при исполнении программы хранятся данные, которые больше не нужны после завершения программы.
sort
читает со стандартного ввода, если в командной строке не указаны файлы или вы используете в качестве имени файла '
–
'. Тем не менее,
sort
должна прочесть
все
свои входные данные, прежде чем сможет вывести отсортированные результаты. (Подумайте об этом немного, и вы увидите, что это так.) Когда читается стандартный ввод, данные должны быть где-то сохранены, прежде чем
sort
сможет их отсортировать; это отличное применение для временного файла.
sort
использует временные файлы также для хранения промежуточных результатов сортировки.
Удивительно, но имеются пять различных функций для создания временных файлов. Три из них работают посредством создания строк, представляющих (предположительно) уникальные имена файлов. Как мы увидим, их обычней следует избегать. Оставшиеся две работают путем создания и открытия временного файла; эти функции предпочтительнее для использования.
12.3.1. Создание временных имен файлов (плохо)
Имеются три функции, назначением которых является создание имени уникального, не существующего файла. Получив такое имя, вы можете использовать его для создания временного файла. Поскольку имя уникально, вам «гарантируется» исключительное использование файла. Вот объявления функций:
Все эти функции предусматривают различные вариации одной и той же темы они заполняют или создают буфер с путем уникального временного имени файла. Файл уникален в том, что создаваемое имя не существует во время создания и возвращения его функциями. Функции работают следующим образом:
char *tmpnam(char *s)
Генерирует уникальное имя файла. Если
s
не равен
NULL
, он должен быть размером по крайней мере
L_tmpnam
байтов, и в него копируется уникальное имя. Если
s
равен
NULL
, имя генерируется во внутреннем статическом буфере, который может быть переписан при последующих вызовах. Префикс каталогов в пути будет
P_tmpdir
. Как
P_tmpdir
, так и
L_tmpnam
определены в
<stdio.h>
.
char *tempnam(const char *dir, const char *pfx)
Подобно
tmpnam
дает вам возможность указать префикс каталогов. Если
dir
равен
NULL
, используется
P_tmpdir
. Аргумент
pfx
, если он не равен
NULL
, определяет до пяти символов для использования в качестве начальных символов имени файла
tempnam
выделяет память для имен файлов, которые она генерирует. Возвращенный указатель может впоследствии использоваться с
free
(и это следует сделать, если хотите избежать утечек памяти).