《XML與正則表達(dá)式》PPT課件.ppt_第1頁
《XML與正則表達(dá)式》PPT課件.ppt_第2頁
《XML與正則表達(dá)式》PPT課件.ppt_第3頁
《XML與正則表達(dá)式》PPT課件.ppt_第4頁
《XML與正則表達(dá)式》PPT課件.ppt_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第8章XML和正則表達(dá)式,正則表達(dá)式(Regular Expression )在處理文本和模式匹配的問題上是實(shí)用有效的,因此XML也導(dǎo)入了正則表達(dá)式的子通訊端口。 本章重點(diǎn)介紹正則表達(dá)式在XML中的應(yīng)用。8.1正則表達(dá)式在XML中的應(yīng)用。 可以使用正則表達(dá)式指定字符串模式。 在XML類別中,主要在以下方面使用。 在xml架構(gòu)中應(yīng)用xml架構(gòu)牛鼻子XPath 2.0 XSLT 2.0,8.1.1時(shí),正則表達(dá)式可以在驗(yàn)證時(shí)指定字符串匹配模式。 下面的示例查詢密碼說明了正則表達(dá)式的使用。 上面的查詢密碼定義了匹配模式“a-z30-93”。 以下查詢密碼所示的元素可以通過驗(yàn)證。 abc123和8.1.

2、2在XPath 2.0中的使用允許在XPath 2.0的三個函數(shù)matches ()、replace ()和tokenize ()中使用正則表達(dá)式。 以下XSLT查詢密碼使用了三個這些個函數(shù): 查詢密碼說明: matches(2007-03-01、d4-d2-d2 )為真。 replace(2007-03-01、(d4)-(d2)-(d2)、$2/$3/$1)變更為字串03/01/2007。 tokenize(2007-03-01,- )符合順序(2007,03,01 )。在XSLT 2.0中應(yīng)用8.1.3,在XSLT 2.0中應(yīng)用正則表達(dá)式是主要因素。 下面的示例查詢密碼說明了正則表達(dá)式在此

3、元素中的使用。 non-letter,8.2 XML正則表達(dá)式的概要,很多軟件編程語言都通訊端口正則表達(dá)式。 這些個語言正則表達(dá)式的基本結(jié)構(gòu)相同,但語法卻完全不同。 XML正則表達(dá)式與Perl的正則表達(dá)式非常相似。 實(shí)際上,XML正則表達(dá)式本來將Perl正則表達(dá)式定義為藍(lán)色。 本節(jié)簡要介紹了XML正則表達(dá)式的基本語法結(jié)構(gòu)。 8.2.1元字符和普通字符,正則表達(dá)式的定義以字符為基本單位。 字符可以分為元字符和普通字符兩種。 元字符是在正則表達(dá)式中表示特殊意義的字符。 中繼字元有.、? 中的符號、符號、符號、符號、符號、符號、符號、符號、符號、符號、符號和符號。 普通字符是指除元字符以外的所有Un

4、icode字符。 普通的文字與其本身相匹配。 當(dāng)然,如果使用時(shí)flags標(biāo)志包含“I”,則普通字符也可以匹配其大小寫格式。 元字符“.”用于匹配任何單個字符(換行符除外)。 如果flags標(biāo)志包含“s”,則“.”與包含換行符的所有字符相匹配。 元字符“”和“$”與輸入字符串的開始和結(jié)束相匹配。 在缺省奧爾特下,此處的開始和結(jié)束表示整個字符串的開始和結(jié)束。 如果flags標(biāo)志包含“m”,則整個字符串在換行處被視為一行的末尾,在換行的下一個字符處被視為另一行的開始。 例如,正則表達(dá)式“The”與字符串“The”匹配,正則表達(dá)式“doc$”與字符串“doc”匹配。 8.2.2量詞、量詞用于指定文字的

5、出現(xiàn)次數(shù)。 量詞的形式主要是“? 中的*、 元字符“? ”表現(xiàn)為量詞,匹配0個字符或1個字符。 比如說a? 的雙曲馀弦值。 表示0個字符或1個字符“a”。 元字符“*”表現(xiàn)為量詞,匹配0個字符以上。 例如,A*表示0個以上的字符“a”。 元字符“”表現(xiàn)為量詞,匹配一個或多個字符。 例如,a表示一個或多個字符“a”。 元字符“”和“”作為量詞出現(xiàn),用于匹配指定個數(shù)的字符,其形式有三種。8.2.3字符轉(zhuǎn)義和字符類、元字符在正則表達(dá)式中具有特殊意義。 如果需要使用原意,則需要退出字符。 字符轉(zhuǎn)義是使用字符“”實(shí)現(xiàn)的。 語法模式是“”元字符。 例如,“.”表示普通字符“.”。 匹配字符串“. xml”

6、; 普通字符“”必須用“”表示。 字符類是可選的字符定徑套。 字符轉(zhuǎn)義是實(shí)現(xiàn)字符類的模式。 字符轉(zhuǎn)義實(shí)現(xiàn)的字符類可以分為一個字符匹配和多個字符匹配兩類。 單字符匹配意味著字符定徑套中只包含一個字符,而多字符匹配意味著字符定徑套中包含多個字符。單字符匹配包括: 與換行符(x0A )相匹配的“n”。 “r”與回車(x0D )相匹配。 t用于匹配標(biāo)簽(x09 )。 中繼字元.、? *、*、|、$、分別加上前綴,實(shí)現(xiàn)轉(zhuǎn)義,表示文字本身。 多角色匹配有以下幾種。 “s”用于匹配空白字符。 如上所述,空白字符包括空格(x20 )、標(biāo)簽(x09 )、換行(x13 )、換行(x0A )。 I用于匹配XML元素

7、和可用作屬性名稱的第一個字符的字符。 包含所有字母文字,包括“:”和“_”。 例如,matches(_,I )返回真,而maches (? I )返回假。 c用于匹配可用作XML命名約定的字符,或者可用作XML元素或?qū)傩悦Q的字符。 例如,matches (.c )返回真,而matches (.c )返回假。 “d”是為了使數(shù)值一致而使用的。 例如,matches(1,d )返回真,而matches(a,d )返回假。 “w”用于匹配可用作構(gòu)成單詞的字符的字符。 例如,matches(Z,w )返回真,而matches (? d )返回假。 的雙曲馀弦值。 以上所有字符類都是XML正則表達(dá)式中

8、的字符集合。 此外,還可以使用“”來客制化字符類。 例如,使用az來匹配字符a或z,使用a-z0-9來匹配字符“a”到字符“z”中的任何字符,使用a-z0-9來匹配字符“z”或字符“0”到字符“9”,“”實(shí)際上將某個范圍的字符如果需要表示范圍外的字符集合,可以使用字符“”。 例如,az可用于表示除a和z之外的所有Unicode字符。 注意這里的“”和行頭匹配的“”的區(qū)別。 行首匹配必須顯示在正則表達(dá)式的開頭,代表完成關(guān)定徑套字的必須顯示在的內(nèi)部。8.2.4字符組的使用,在XML的正則表達(dá)式中也可以使用“()”對正則表達(dá)式進(jìn)行分組。 可以用量詞修飾組,大大擴(kuò)展了正則表達(dá)式的功能。 例如,“Hel

9、lo,Hello,World”與正則表達(dá)式“(Hello,) 2”相匹配。 XPath函數(shù)可以使用$1、$2、$3$n來引用與相應(yīng)組匹配的字符串。 例如,替換(1234 DD、(d4)(w2)和$2$1)返回字符串“dd1234”。 在XSLT 2.0元素中,可以使用函數(shù)regex-group ()來引用分組。 下面的查詢密碼是一個示例計(jì)程儀報(bào)片段。 8.2.5正則表達(dá)式早午餐。 “|”可以創(chuàng)建多個正則表達(dá)式早午餐。 例如,“d4|w4”可被視為兩個正則表達(dá)式“d4”和“w4”,匹配任何正則表達(dá)式的字符串可被視為匹配整個正則表達(dá)式。 如果字符串的兩個正則表達(dá)式早午餐都匹配,則處理匹配第一個正則表達(dá)式早午餐。 總結(jié),本章論述XML正則表達(dá)式的基礎(chǔ)知識。 XML正則表達(dá)式是基于Perl正則表達(dá)式的手板模型,但與Perl的正則表達(dá)式完全不同。 特別注意,XML正則表達(dá)式中添加了兩個自己的字符類“I”和“c”。 XML正則表達(dá)式可以在XML架構(gòu)、Xpath 2.0和XSLT 2.0中使用。 在Xpath 2.0和XSLT 2.0中,雖然只有一些函數(shù)和元素,但XML

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論