3.2.1.7. Использование персональных программ распределения
Набор функций с
malloc
является набором общего назначения по выделению памяти. Он должен быть способен обработать запросы на произвольно большие или маленькие размеры памяти и осуществлять все необходимые учетные действия при освобождении различных участков выделенной памяти. Если ваша программа выделяет значительную динамическую память, вы можете обнаружить, что она тратит большую часть своего времени в функциях
malloc
.
Вы можете написать персональную
программу распределения — набор функций или макросов, которые выделяют большие участки памяти с помощью
malloc
, а затем дробят их на маленькие кусочки по одному за раз. Эта методика особенно полезна, если вы выделяете множество отдельных экземпляров одной и той же сравнительно небольшой структуры.
Например, GNU awk (gawk) использует эту методику. Выдержка из файла
awk.h
в дистрибутиве
gawk
(слегка отредактировано, чтобы уместилось на странице):
указывает на связанный список структур NODE. Макрос
getnode
убирает из списка первую структуру, если она там есть. В противном случае она вызывает
more_nodes
, чтобы выделить новый список свободных структур
NODE
. Макрос
freenode
освобождает структуру
NODE
, помещая его в начало списка.
ЗАМЕЧАНИЕ. Первоначально при написании своего приложения делайте это простым способом: непосредственно используйте
malloc
и
free
. Написание собственного распределителя вы должны рассмотреть лишь в том и только в том случае, если профилирование вашей программы покажет, что она значительную часть времени проводит в функциях выделения памяти.
3.2.1.8. Пример: чтение строк произвольной длины
Поскольку это, в конце концов, Программирование на Linux в примерах, настало время для примера из реальной жизни. Следующий код является функцией
readline
из GNU Make 3.80 (
ftp://ftp.gnu.org/gnu/make/make-3.80.tar.gz
). Ее можно найти в файле
read.c
.
Следуя принципу «никаких произвольных ограничений», строки в
Makefile
могут быть любой длины. Поэтому главной задачей этой процедуры является чтение строк произвольной длины и гарантирование того, что они помещаются в используемый буфер.
Вторичной задачей является распоряжение продлением строк. Как и в С, строки, заканчивающиеся обратным слешем, логически продолжаются со следующей строки. Используется стратегия поддержания буфера. В нем хранится столько строк, сколько помещается в буфер, причем указатели отслеживают начало буфера, текущую строку и следующую строку. Вот структура:
struct ebuffer {
char *buffer; /* Начало текущей строки в буфере. */
char *bufnext; /* Начало следующей строки в буфере. */
char *bufstart; /* Начало всего буфера. */
unsigned int size; /* Размер буфера для malloc. */
FILE *fp; /* Файл или NULL, если это внутренний буфер. */
struct floc floc; /* Информация о файле в fp (если он есть). */
};
Поле
size
отслеживает размер всего буфера, a
fp
является указателем типа
FILE
для файла ввода. Структура floc не представляет интереса при изучении процедуры.
Функция возвращает число строк в буфере. (Номера строк здесь даны относительно начала функции, а не исходного файла.)
1 static long
2 readline(ebuf) /* static long readline(struct ebuffer *ebuf) */
3 struct ebuffer *ebuf;
4 {
5 char *p;
6 char *end;
7 char *start;
8 long nlines = 0;
9
10 /* Использование строковых буферов и буферов потоков достаточно
11 различается, чтобы использовать разные функции. */
12
13 if (!ebuf->fp)
14 return readstring(ebuf);
15
16 /* При чтении из файла для каждой новой строки мы всегда
17 начинаем с начала буфера. */
18
19 p = start = ebuf->bufstart;
20 end = p + ebuf->size;
21 *p = '\0';
Для начала заметим, что GNU Make написан на С K&R для максимальной переносимости. В исходной части объявляются переменные, и если ввод осуществляется из строки (как в случае расширения макроса), код вызывает другую функцию,
readstring
(строки 13 и 14). Строка '
!ebuf->fp
' (строка 13) является более короткой (и менее понятной, по нашему мнению) проверкой на пустой указатель; это то же самое, что и '
ebuf->fp==NULL
'.
Строки 19-21 инициализируют указатели и вводят байт NUL, который является символом завершения строки С в конце буфера. Затем функция входит в цикл (строки 23–95), который продолжается до завершения всего ввода.