Java正則表達(dá)式(補(bǔ)充知識(shí)).ppt_第1頁
Java正則表達(dá)式(補(bǔ)充知識(shí)).ppt_第2頁
Java正則表達(dá)式(補(bǔ)充知識(shí)).ppt_第3頁
Java正則表達(dá)式(補(bǔ)充知識(shí)).ppt_第4頁
Java正則表達(dá)式(補(bǔ)充知識(shí)).ppt_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Java正則表達(dá)式,重要聲明,許多語言,包括Perl、PHP、Python、JavaScript和JScript,都支持用正則表達(dá)式處理文本,一些文本編輯器用正則表達(dá)式實(shí)現(xiàn)高級(jí)“搜索-替換”功能 Java正則表達(dá)式不是javascript正則表達(dá)式,Java正則表達(dá)式優(yōu)點(diǎn),使用java正則表達(dá)式與傳統(tǒng)編程相比 優(yōu)點(diǎn): 在判斷EMAIL等傳統(tǒng)編程方法可能需要一二十行代碼,使用正則表達(dá)式只需幾行代碼而已 提高編程效率 弊端: 需要學(xué)習(xí)java正則表達(dá)式的用法。,基礎(chǔ)知識(shí)部分,開始java正則表達(dá)式的基礎(chǔ)知識(shí),正則表達(dá)式基礎(chǔ)知識(shí),我們先從簡單的開始。假設(shè)你要搜索一個(gè)包含字符“cat”的字符串,搜索用

2、的正則表達(dá)式就是“cat”。如果搜索對(duì)大小寫不敏感,單詞“catalog”、“Catherine”、“sophisticated”都可以匹配。也就是說:,1.1 句點(diǎn)符號(hào),假設(shè)你在玩英文拼字游戲,想要找出三個(gè)字母的單詞,而且這些單詞必須以“t”字母開頭,以“n”字母結(jié)束。你可以使用一個(gè)通配符句點(diǎn)符號(hào)“.”。這樣,完整的表達(dá)式就是“t.n”,它匹配“tan”、“ten”、“tin”和“ton”,還匹配“t#n”、“tpn”甚至“t n”,還有其他許多無意義的組合。句點(diǎn)符號(hào)匹配所有字符,包括空格、Tab字符甚至換行符:,1.2 方括號(hào)符號(hào),句點(diǎn)優(yōu)點(diǎn)是通用,同時(shí)缺點(diǎn)也是通用 為了解決句點(diǎn)符號(hào)匹配范圍

3、過于廣泛這一問題,你可以在方括號(hào)(“”)里面指定看來有意義的字符。此時(shí),只有方括號(hào)里面指定的字符才參與匹配。也就是說,正則表達(dá)式“taeion”只匹配“tan”、“Ten”、“tin”和“ton”。但“Tun”不匹配,因?yàn)槟阒荒芷ヅ浞嚼ㄌ?hào)出現(xiàn)的單個(gè)字符,在Editplus中舉例說明。,1.3 “或”符號(hào),句點(diǎn)和方括號(hào)只匹配單個(gè)字符,如果要匹配多個(gè)字符就要看”或”運(yùn)算符了 如果除了上面匹配的所有單詞之外,你還想要匹配“toon”,那么,你可以使用“|”操作符?!皘”操作符的基本意義就是“或”運(yùn)算。要匹配“toon”,使用“t(a|e|i|o|oo)n”正則表達(dá)式。這里不能使用方擴(kuò)號(hào),因?yàn)榉嚼ㄌ?hào)只

4、允許匹配單個(gè)字符;這里必須使用圓括號(hào)“()”。圓括號(hào)還可以用來分組,具體請(qǐng)參見后面介紹。,在Editplus中舉例說明。,1.4.1 表示匹配次數(shù)的符號(hào),遇到單個(gè)字符的重復(fù)問題,就要看下面的符號(hào)表了 表一顯示了表示匹配次數(shù)的符號(hào),這些符號(hào)用來確定緊靠該符號(hào)左邊的符號(hào)出現(xiàn)的次數(shù):,舉例: 正則表達(dá)式:c(a|o|i|a*)t 字符串:cat catttt catalog cot cit cet caaaat,1.4.2常用符號(hào)小結(jié)1,句點(diǎn).表示單個(gè)字符 方括號(hào)表示可能出現(xiàn)字符集里的單個(gè)字符 括號(hào)()可表示多個(gè)字符 大括號(hào)表示次數(shù) 轉(zhuǎn)義字符“” 一般正則表達(dá)式是由通配符和固定字符組成,1.4.3實(shí)

5、例,圖:匹配所有123-12-1234形式的社會(huì)安全號(hào)碼,假設(shè)我們要在文本文件中搜索美國的社會(huì)安全號(hào)碼。這個(gè)號(hào)碼的格式是999-99-9999。用來匹配它的正則表達(dá)式。在正則表達(dá)式中,連字符(“-”)有著特殊的意義,它表示一個(gè)范圍,比如從0到9。因此,匹配社會(huì)安全號(hào)碼中的連字符號(hào)時(shí),它的前面要加上一個(gè)轉(zhuǎn)義字符“”。 看看下面那一行正則表達(dá)式是對(duì)的: (0-9)3 -(0-9)2 - (0-9)4 0-93 -0-92 - 0-94 正確的是:,1.4.4實(shí)例,假設(shè)進(jìn)行搜索的時(shí)候,你希望連字符號(hào)可以出現(xiàn),也可以不出現(xiàn)即,999-99-9999和999999999都屬于正確的格式。這時(shí),你可以在連

6、字符號(hào)后面加上一個(gè)數(shù)量限定符號(hào),如圖所示: 看看下面那一行正則表達(dá)式是對(duì)的: (0-9)3 -?(0-9)2 -? (0-9)4 0-93 -*0-92 -* 0-94 正確的是:,圖:匹配所有123-12-1234和123121234形式的社會(huì)安全號(hào)碼,1.4.5實(shí)例3,下面我們?cè)賮砜戳硗庖粋€(gè)例子。美國汽車牌照的一種格式是四個(gè)數(shù)字加上二個(gè)字母。它的正則表達(dá)式前面是數(shù)字部分“0-94”,再加上字母部分“A-Z2”。圖顯示了完整的正則表達(dá)式。,圖:匹配典型的美國汽車牌照號(hào)碼,如8836KV,1.5 “否”符號(hào),“”符號(hào)稱為“否”符號(hào)。如果用在方括號(hào)內(nèi),“”表示不想要匹配的字符。例如,圖四的正則表

7、達(dá)式匹配所有單詞,但以“X”字母開頭的單詞除外。,圖:匹配所有單詞,但“X”開頭的除外,1.6.1 圓括號(hào)和空白符號(hào),假設(shè)要從格式為“June 26, 1951”的生日日期中提取出月份部分,用來匹配該日期的正則表達(dá)式可以如圖所示: 看看下面哪一個(gè)是正確的: a-z* s+ 0-91,2,s* 0-94 a-z+ s+ 0-91,2,s* 0-94 正確的是:,圖:匹配所有Moth DD,YYYY格式的日期,1.6.2 圓括號(hào)和空白符號(hào),新出現(xiàn)的“s”符號(hào)是空白符號(hào),匹配所有的空白字符,包括Tab字符。如果字符串正確匹配,接下來如何提取出月份部分呢?只需在月份周圍加上一個(gè)圓括號(hào)創(chuàng)建一個(gè)組,然后用

8、ORO API(本文后面詳細(xì)討論)提取出它的值。修改后的正則表達(dá)式如圖所示:,圖:匹配所有Month DD,YYYY格式的日期,定義月份值為第一個(gè)組,1.7.1 其它符號(hào),為簡便起見,你可以使用一些為常見正則表達(dá)式創(chuàng)建的快捷符號(hào)。如表二所示: 表二:常用符號(hào),1.7.2 其它符號(hào),例如,在前面社會(huì)安全號(hào)碼的例子中,所有出現(xiàn)“0-9”的地方我們都可以使用“d”。修改后的正則表達(dá)式如圖所示:,圖:匹配所有123-12-1234格式的社會(huì)安全號(hào)碼,1.8常用符號(hào)總結(jié),句點(diǎn).表示單個(gè)字符 方括號(hào)表示可能出現(xiàn)字符集里的單個(gè)字符 括號(hào)()可表示多個(gè)字符,還有分組功能 大括號(hào)表示次數(shù) 轉(zhuǎn)義字符“” 一般正則

9、表達(dá)式是由通配符和固定字符組成 ”符號(hào)稱為“否”符號(hào) d D w W s S等快捷符號(hào),實(shí)戰(zhàn)部份,開始java正則表達(dá)式的實(shí)戰(zhàn)講解部份,用正則表達(dá)式判斷一個(gè)字符串是否可以表示數(shù)字 regex=1-90-9*.?0-9*;,class Example_reg1 public static void main(String args) String regex=1-90-9*.?0-9*; String str1=12y345; String str2=123.456; if (str1.matches(regex) System.out.println(str1+是合法的數(shù)字); else Sy

10、stem.out.println(str1+是非法的數(shù)字); if (str2.matches(regex) System.out.println(str2+是合法的數(shù)字); else System.out.println(str2+是非法的數(shù)字); ,合法Email地址檢測(cè) regex=w1,w1,56w1,public class Example5_12 public static void main (String args ) String regex=w1,w1,.w1, ; String str1=; String str2=; if(str1.matches(regex) System.out.println(str1+是一個(gè)Email地址); else System.out.println(str1+不是一個(gè)Email地址); if(str2.matches(regex) System.out.println(str2+是一個(gè)Email地址); else System.out.println(str2+不是一個(gè)Email地址); ,應(yīng)用實(shí)例,日志分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論