Разработка приложений в среде Linux. Второе издание
Шрифт:
Ниже представлен пример типичного вызова функции.
if ((rerr = regcomp(&p, "(^(.*[^\\])#.*$)|(^[^#]+$)",
REG_EXTENDED|REG_NEWLINE))) {
if (rerr == REG_NOMATCH) {
/* строка просто не совпадает с регулярным выражением */
} else {
/* какая-то другая ошибка, например, неправильно сформированное регулярное выражение */
}
}
Данное расширенное регулярное выражение находит строки в файле, которые не включены в комментарии, или которые, по
#
без префикса \
. Эту разновидность регулярного выражения удобно использовать в качестве простого анализатора синтаксиса для конфигурационного файла какого-нибудь приложения. Даже если вы компилируете выражение, которое, по вашему мнению, является нормальным, вам все равно необходимо проверить его на наличие ошибок. Функция
regcomp
возвращает нулевое значение при успешном выполнении компиляции и ненулевой код ошибки — в противном случае. Большинство ошибок может быть связано с разного рода ошибками в регулярных выражениях, но не исключено, что ошибка может быть связана с переполнением памяти. Далее в этой главе дается описание функции regerror
. #include <regex.h>
int regexec(const regex_t *preg, const chat *string, size_t nmatch,
regmatch_t pmatch[], int eflags);
Функция
regexec
сравнивает строку с предварительно компилированным регулярным выражением. Аргумент eflags
может иметь нулевое значение или быть любой комбинацией перечисленных ниже значений, объединенных битовым "ИЛИ". REG_NOTBOL | Первый символ строки не будет соответствовать символу ^ . Любой символ, следующий за символом новой строки, будет соответствовать при том условии, что в вызове функции regcomp будет задано значение REG_NEWLINE . |
REG_NOTEOL | Последний символ строки не будет соответствовать символу $ . Любой символ, предшествующий символу новой строки, будет соответствовать символу $ при том условии, что в вызове функции regcomp будет задано значение REG_NEWLINE . |
Массив структур
regmatch_t
используется для представления местоположения подвыражений в регулярном выражении. #include <regex.h>
typedef struct {
regoff_t rm_so; /* индекс байта в строке в начале сопоставления*/
regoff_t rm_eo; /* индекс байта в строке в конце сопоставления*/
} regmatch_t;
Первый элемент
regmatch_t
описывает всю совпавшую строку; обратите внимание, что вся эта строка содержит любой символ начала строки, включая хвостовой символ новой строки, независимо от того, задано ли значение REG_NEWLINE
. Следующие элементы массива хранят подвыражения, заключенные в скобки, в том порядке, в котором они присутствуют в регулярном выражении, в порядке расположения открывающих скобок. (В коде на языке С элемент
i
эквивалентен выражению замены \i
в программах sed
или awk
.) В несовпадающих подвыражениях член regmatch_t.rm_so
имеет значение – 1
. В следующем коде производится сопоставление строки с регулярным выражением, содержащим подвыражения. После сопоставления на экран выводятся все совпавшие подвыражения.
1: /* match.с */
2:
3: #include <alloca.h>
4: #include <sys/types.h>
5: #include <regex.h>
6: #include <stdlib.h>
7: #include <string.h>
8: #include <stdio.h>
9:
10: void do_regerror(int errcode, const regex_t *preg) {
11: char *errbuf;
12: size_t errbuf_size;
13:
14: errbuf_size = regerror(errcode, preg, NULL, 0);
15: errbuf = alloca(errbuf_size);
16: if (!errbuf) {
17: perror("alloca");
18: return;
19: }
20:
21: regerror(errcode, preg, errbuf, errbuf_size);
22: fprintf(stderr, "%s\n", errbuf);
23: }
24:
25: int main {
26:
27: regex_t p;
28: regmatch_t *pmatch;
29: int rerr;
30: char *regex = "(^(.*[^\\])#.*$)|(^[^#]+$)";
31: char string[BUFSIZ+1];
32: int i;
33:
34: if ((rerr = regcomp(&p, regex, REG_EXTENDED | REG_NEWLINE))) {
35: do_regerror(rerr, &p);
36: }
37:
38: pmatch = alloca(sizeof(regmatch_t) * (p.re_nsub+1));
39: if (!pmatch) {
40: perror("alloca");
41: }
42:
43: printf("Введите строку: ");
44: fgets(string, sizeof(string), stdin);
45:
46: if ((rerr = regexec(&p, string, p.re_nsub+1, pmatch, 0))) {
47: if (rerr == REG_NOMATCH) {
48: /* эту ситуацию может обработать regerror,
49: * но зачастую она обрабатывается особым образом
50: */
51: printf("Строка не совпадает с %s\n", regex);
52: } else {
53: do_regerror(rerr, &p);
54: }
55: } else {
56: /* сопоставление закончено */
57: printf("Строка совпадает с регулярным выражением %s\n", regex);
Поделиться:
Популярные книги
Рядовой. Назад в СССР. Книга 1
1. Второй шанс
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Смерть может танцевать 4
4. Безликий
Фантастика:
боевая фантастика
5.85
рейтинг книги
Попытка возврата. Тетралогия
Попытка возврата
Фантастика:
альтернативная история
9.26
рейтинг книги
Энфис 3
3. Эрра
Фантастика:
героическая фантастика
рпг
аниме
5.00
рейтинг книги
Восход. Солнцев. Книга V
5. Голос Бога
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Старатель
1. Старатели
Фантастика:
боевая фантастика
космическая фантастика
5.00
рейтинг книги
Восход. Солнцев. Книга I
1. Голос Бога
Фантастика:
фэнтези
попаданцы
аниме
5.00
рейтинг книги
Холодный ветер перемен
7. Девяностые
Фантастика:
попаданцы
альтернативная история
6.80
рейтинг книги
Безымянный раб [Другая редакция]
1. Дорога домой
Фантастика:
боевая фантастика
9.41
рейтинг книги
Брак по-драконьи
Фантастика:
фэнтези
8.60
рейтинг книги
На границе империй. Том 8
12. Фортуна дама переменчивая
Фантастика:
космическая фантастика
попаданцы
5.00
рейтинг книги
Паладин из прошлого тысячелетия
1. Соприкосновение миров
Фантастика:
боевая фантастика
попаданцы
6.25
рейтинг книги
На границе империй. Том 5
5. Фортуна дама переменчивая
Фантастика:
боевая фантастика
попаданцы
7.50
рейтинг книги
Серые сутки
4. Медорфенов
Фантастика:
фэнтези
аниме
5.00