W3C дает формальное определение образцов выбора в нотации расширенных форм Бэкуса-Наура (РБНФ), при помощи которой написана и спецификация XML. Объяснение этой грамматики можно найти по адресу www.w3.org/TR/REC-xml (раздел 6). Здесь я привожу формальное определение образцов только для справки. (Разъяснению этого формального определения посвящена целая глава.) В следующем списке приведены используемые здесь лексемы нотации РБНФ:
•
::=
означает «определяется как»;
•
+
означает «один или больше»;
•
*
означает «ноль или больше»;
•
|
означает «или»;
•
–
означает «не»;
•
?
означает «необязательно».
Далее приведено настоящее, формальное определение образцов выбора W3C; когда элемент заключен в одиночные кавычки, как
'child'
или
'::'
, это значит, что элемент должен появиться в образце буквально (как "
child::NAME
"), — такие элементы называются литералами, Literal:
Как вы можете видеть, все это больше походит на какой-то код. Давайте начнем его расшифровывать. Во-первых, образец (pattern) состоит из одного (или более) образца пути расположения (location path pattern). Образец пути расположения, в свою очередь, состоит из одного или нескольких образцов шага (step pattern), разделенных / или //, или одним (несколькими) образцом шага в объединении с функциями
id
и
key
(выбирающими элементы с определенными идентификаторами или ключами).
Образцы шага являются строительными блоками шаблонов: в одном пути можно
использовать несколько шагов, разделяя их символами / или //, как в образце "
PLANET/*/ NAME
", в котором три шага: "
PLANET
", "
*
" и "
NAME
". Если вы начнете сам образец с символа /, он будет называться абсолютным, так как вы указали образец от корневого узла (как в "
/PLANETS/PLANET
" или "
//PLANET
"); иначе образец называется относительным и применяется начиная с контекстного узла (как в "
PLANET
").
Затем образец шага состоит из оси, условия узла и предикатов (которых может и не быть). Например, в выражении
child::PLANET[position=5]
,
child
— это имя оси,
PLANET
— условие узла, a
[position=5]
— это предикат. (Предикаты всегда заключены в квадратные скобки.) Образцы можно создавать при помощи одного или более образцов шага, как, например, образец
/child::PLANET/child::NAME
, который выбирает элементы
<NAME>
, дочерние по отношению к родителю
<PLANET>
.
Таким образом, чтобы понять работу образцов, вам необходимо понять работу образцов шага, поскольку образцы состоят из одного или более образцов шага, в таких выражениях, как "
step-pattern1/step-pattern2/step-pattern3
…". А чтобы понять работу образца шага, необходимо понять работу деятельности трех составных частей — осей, условий узлов и предикатов, которыми мы и займемся в следующих разделах.
Образцы шага, часть 1: оси образца
Оси — первая часть образцов шага. Например, в образце шага
child::NAME
, ссылающемся на элемент
<NAME>
, дочерний по отношению к контекстному узлу,
child
называется осью. У образцов две оси:
• ось
attribute
содержит атрибуты контекстного узла;
• ось
child
содержит детей контекстного узла. Если ось явно не задана, ось
child
будет осью по умолчанию.
При помощи осей можно задать шаг расположения (location path) или путь, как в следующем примере, в котором ось
child
используется для задания выбора дочерних узлов контекстного узла, элемента