XPath節點類型
由于XPath包含的是對文檔結構樹的一系列操作,因此搞清楚XPath節點類型也是很必要的。在XML文檔的邏輯結構,一個 XML文件可以包含元素、CDATA、注釋、處理指令等邏輯要素,其中元素還可以包含屬性,并可以利用屬性來定義命名空間。相應地,在XPath中,將節點劃分為七種節點類型:
根節點(Root Node)
根節點是一棵樹的最上層,根節點是唯一的。樹上其它所有元素節點都是它的子節點或后代節點。對根節點的處理機制與其它節點相同。在XSLT中對樹的匹配總是先從根節點開始。
元素節點(Element Nodes)
元素節點對應于文檔中的每一個元素,一個元素節點的子節點可以是元素節點、注釋節點、處理指令節點和文本節點。可以為元素節點定義一個唯一的標識id。元素節點都可以有擴展名,它是由兩部分組成的:一部分是命名空間URI,另一部分是本地的命名。
文本節點(Text Nodes)
文本節點包含了一組字符數據,即CDATA中包含的字符。任何一個文本節點都不會有緊鄰的兄弟文本節點,而且文本節點沒有擴展名。
屬性節點(Attribute Nodes)
每一個元素節點有一個相關聯的屬性節點集合,元素是每個屬性節點的父節點,但屬性節點卻不是其父元素的子節點。這就是說,通過查找元素的子節點可以匹配出元素的屬性節點,但反過來不成立,只是單向的。再有,元素的屬性節點沒有共享性,也就是說不同的元素節點不共有同一個屬性節點。
對缺省屬性的處理等同于定義了的屬性。如果一個屬性是在DTD聲明的,但聲明為 #IMPLIED,而該屬性沒有在元素中定義,則該元素的屬性節點集中不包含該屬性。
此外,與屬性相對應的屬性節點都沒有命名空間的聲明。命名空間屬性對應著另一種類型的節點。
命名空間節點(Namespace Nodes)
每一個元素節點都有一個相關的命名空間節點集。在XML文檔中,命名空間是通過保留屬性聲明的,因此,在XPath中,該類節點與屬性節點極為相似,它們與父元素之間的關系是單向的,并且不具有共享性。
處理指令節點(Processing Instruction Nodes)
處理指令節點對應于XML文檔中的每一條處理指令。它也有擴展名,擴展名的本地命名指向處理對象,而命名空間部分為空。
注釋節點(Comment Nodes)
注釋節點對應于文檔中的注釋。
一個XML文檔樹
我們來構造一棵XML文檔樹,作為后面舉例的依托:
代碼如下:
<A id="a1">
<B id="b1">
<C id="c1">
<B name="b"/>
<D id="d1"/>
<E id="e1"/>
<E id="e2"/>
</C>
</B>
<B id="b2"/>
<C id="c2">
<B/>
<D id="d2"/>
<F/>
</C>
<E/>
</A>
以下將要介紹一些XPath中節點匹配的基本方法。
路徑匹配
路徑匹配與文件路徑的表示相仿,比較好理解。有以下幾個符號:
(1)用“/”指示節點路徑
如“/A/C/D” 表示節點"A"的子節點"C"的子節點"D",即id值為d2的D節點, “/”表示根節點。
(2)用“//” 表示所有路徑以"http://"后指定的子路徑結尾的元素
如“//E” 表示所有E元素,結果是所有三個E元素,如“//C/E”表示所有父節點為C的E元素,結果是id值為e1和e2的兩個E元素 。
(3)用“*” 表示路徑的通配符
如“/A/B/C/*”表示 A元素→B元素→C元素下的所有子元素,即name值為b的B元素、 id值為d1的D元素和id值為e1和e2的兩個E元素
“/*/*/D”表示上面有兩級節點的D元素,匹配結果是id值為d2的D元素 ,如“//*”表示所有的元素。
位置匹配
對于每一個元素,它的各個子元素是有序的。
如:/A/B/C[1]表示A元素→B元素→C元素的第一個子元素,得到name值為b的B元素
/A/B/C[last()]表示A元素→B元素→C元素的最后一個子元素,得到id值為e2的E元素
/A/B/C[position()>1]表示A元素→B元素→C元素之下的位置號大于1的元素,得到id值為d1的D元素和兩個具有id值的E元素
屬性及屬性值
在XPath中可以利用屬性及屬性值來匹配元素,要注意的是,元素的屬性名前要有"@"前綴。例如:
//B[@id]表示所有具有屬性id的B元素,
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com