Linux программирование в примерах, Роббинс Арнольд

Linux программирование в примерах

на обложку

Роббинс Арнольд

Шрифт:

3.2.1.7. Использование персональных программ распределения

Набор функций с

malloc

является набором общего назначения по выделению памяти. Он должен быть способен обработать запросы на произвольно большие или маленькие размеры памяти и осуществлять все необходимые учетные действия при освобождении различных участков выделенной памяти. Если ваша программа выделяет значительную динамическую память, вы можете обнаружить, что она тратит большую часть своего времени в функциях

malloc

Вы можете написать персональную

программу распределения — набор функций или макросов, которые выделяют большие участки памяти с помощью

malloc

, а затем дробят их на маленькие кусочки по одному за раз. Эта методика особенно полезна, если вы выделяете множество отдельных экземпляров одной и той же сравнительно небольшой структуры.

Например, GNU awk (gawk) использует эту методику. Выдержка из файла

awk.h

в дистрибутиве

gawk

(слегка отредактировано, чтобы уместилось на странице):

#define getnode(n) if (nextfree) n = nextfree, \

nextfree = nextfree->nextp; else n = more_nodes

#define freenode(n) ((n)->flags = 0, (n)->exec_count = 0,\

(n)->nextp = nextfree, nextfree = (n))

Переменная

nextfree

указывает на связанный список структур NODE. Макрос

getnode

убирает из списка первую структуру, если она там есть. В противном случае она вызывает

more_nodes

, чтобы выделить новый список свободных структур

NODE

. Макрос

freenode

освобождает структуру

NODE

, помещая его в начало списка.

ЗАМЕЧАНИЕ. Первоначально при написании своего приложения делайте это простым способом: непосредственно используйте

malloc

free

. Написание собственного распределителя вы должны рассмотреть лишь в том и только в том случае, если профилирование вашей программы покажет, что она значительную часть времени проводит в функциях выделения памяти.

3.2.1.8. Пример: чтение строк произвольной длины

Поскольку это, в конце концов, Программирование на Linux в примерах, настало время для примера из реальной жизни. Следующий код является функцией

readline

из GNU Make 3.80 (

ftp://ftp.gnu.org/gnu/make/make-3.80.tar.gz

). Ее можно найти в файле

read.c

Следуя принципу «никаких произвольных ограничений», строки в

Makefile

могут быть любой длины. Поэтому главной задачей этой процедуры является чтение строк произвольной длины и гарантирование того, что они помещаются в используемый буфер.

Вторичной задачей является распоряжение продлением строк. Как и в С, строки, заканчивающиеся обратным слешем, логически продолжаются со следующей строки. Используется стратегия поддержания буфера. В нем хранится столько строк, сколько помещается в буфер, причем указатели отслеживают начало буфера, текущую строку и следующую строку. Вот структура:

struct ebuffer {

char *buffer; /* Начало текущей строки в буфере. */

char *bufnext; /* Начало следующей строки в буфере. */

char *bufstart; /* Начало всего буфера. */

unsigned int size; /* Размер буфера для malloc. */

FILE *fp; /* Файл или NULL, если это внутренний буфер. */

struct floc floc; /* Информация о файле в fp (если он есть). */

};

Поле

size

отслеживает размер всего буфера, a

является указателем типа

FILE

для файла ввода. Структура floc не представляет интереса при изучении процедуры.

Функция возвращает число строк в буфере. (Номера строк здесь даны относительно начала функции, а не исходного файла.)

1 static long

2 readline(ebuf) /* static long readline(struct ebuffer *ebuf) */

3 struct ebuffer *ebuf;

4 {

5 char *p;

6 char *end;

7 char *start;

8 long nlines = 0;

10 /* Использование строковых буферов и буферов потоков достаточно

11 различается, чтобы использовать разные функции. */

13 if (!ebuf->fp)

14 return readstring(ebuf);

16 /* При чтении из файла для каждой новой строки мы всегда

17 начинаем с начала буфера. */

19 p = start = ebuf->bufstart;

20 end = p + ebuf->size;

21 *p = '\0';

Для начала заметим, что GNU Make написан на С K&R для максимальной переносимости. В исходной части объявляются переменные, и если ввод осуществляется из строки (как в случае расширения макроса), код вызывает другую функцию,

readstring

(строки 13 и 14). Строка '

!ebuf->fp

' (строка 13) является более короткой (и менее понятной, по нашему мнению) проверкой на пустой указатель; это то же самое, что и '

ebuf->fp==NULL

Строки 19-21 инициализируют указатели и вводят байт NUL, который является символом завершения строки С в конце буфера. Затем функция входит в цикл (строки 23–95), который продолжается до завершения всего ввода.