Технология XSLT
Шрифт:
□ Узел, который соответствует пространству имен
□ Узел, который соответствует пространству имен, заданному по умолчанию, если такое есть.
□ По одному узлу на каждый префикс пространств имен, доступный в данном элементе.
Напомним, что пространства имен, доступные в данном элементе, и пространство имен по умолчанию могут быть определены в его предках.
Подобно узлам атрибутов, узлы пространств имен ассоциируются с узлом элемента. Узел элемента является их родительским узлом, но при этом они сами не являются дочерними узлами узла элемента.
Расширенные имена узлов пространств имен состоят из локальной части имени, которая равна префиксу, использованному
Строковым значением узла пространства имен является уникальный идентификатор ресурса (URI), с которым оно связано.
Мы будем помечать узлы пространств имен метками вида
Приведем изображение дерева (рис. 3.8) документа
Рис. 3.8. Изображение дерева документа с узлами пространств имен
Узлы инструкций по обработке
Каждой инструкции по обработке соответствует свой узел. В дерево не включаются узлы инструкций, которые были приведены в декларации типа документа (DTD). Кроме этого, поскольку декларация XML не является инструкцией по обработке, ей не будет соответствовать никакой узел в дереве документа.
Локальной частью расширенного имени инструкции по обработке является имя целевого приложения инструкции. Пространство имен инструкции по обработке всегда нулевое.
Строковым значением инструкции по обработке является ее содержание — последовательность символов, которая начинается после имени приложения и следующего за ним пробела и заканчивается перед символами "
Узел инструкции по обработке помечается именем целевого приложения, заключенным в символы "
Узел инструкции по обработке
Рис. 3.9. Изображение узла инструкции по обработке
Узел комментария
Узел комментария соответствует каждому из комментариев, которые присутствуют в документе кроме тех, которые находятся в декларации типа документа (DTD). Узлы комментариев не имеют имен; их строковым значением является текст комментария — последовательность символов после "
Узел комментария
– ->
Рис. 3.10. Изображение
Сводная таблица характеристик узлов
Для удобства использования мы можем свести в одну таблицу (табл. 3.1) такие характеристики узлов, как строковое значение, локальная часть имени, пространство имен и так далее.
Таблица 3.1. Характеристики различных типов узлов
Тип узла | Характеристики | ||||
---|---|---|---|---|---|
Строковое значение | Расширенное имя | Дочерние узлы | Родительские узлы | ||
Локальная часть имени | Пространство имен | ||||
Корневой узел | Конкатенация текстовых потомков | Нет | Узлы элементов, комментариев, инструкций по обработке | Нет | |
Узел элемента | Конкатенация текстовых потомков | Имя элемента | Пространство имен элемента | Узлы элементов, комментариев, инструкций по обработке, текстовые узлы | Корневой узел или узел элемента |
Узел атрибута | Значение атрибута | Имя атрибута | Пространство имен атрибута | Нет | Узел элемента |
Текстовый узел | Символьные данные | Нет | Нет | Узел элемента | |
Узел пространства имен | URI пространства имен | Префикс пространства имен | Нулевое | Нет | Узел элемента |
Узел инструкции по обработке | Содержимое инструкции | Имя целевого приложения | Нулевое | Нет | Корневой узел или узел элемента |
Узел комментария | Текст комментария | Нет | Нет | Корневой узел или узел элемента |
Ограничения модели XML-документа
Модель XML-документа, описанная выше, является вполне достаточной для того, чтобы манипулировать структурой документа и данными, которые он содержит. Между тем, эта модель имеет определенные ограничения, а именно:
□ Не учитывается информация, содержащаяся в блоке DTD. Как следствие, в XSLT невозможно манипулировать определениями сущностей, элементов, атрибутов и так далее.
□ Не учитываются некоторые синтаксические особенности входящего XML-документа. Например: использовались ли в определенном атрибуте одинарные или двойные кавычки; была ли определенная строка задана сущностью или просто текстом, был ли текст заключен в секции CDATA или нет.
□ Если атрибут элемента был определен в DTD со значением по умолчанию, то в преобразовании нельзя точно сказать, присутствовал ли он физически во входящем документе или нет.
□ Не учитывается, был ли пустой элемент определен как
Одним словом, предложенная выше модель не учитывает информацию, которая не важна с точки зрения структуры документа. На практике помимо структуры бывает также важен и детальный синтаксис документа (например, необходимо вместо