本文實(shí)例講述了正則表達(dá)式教程之匹配一組字符的方法。分享給大家供大家參考,具體如下:
注:在所有例子中正則表達(dá)式匹配結(jié)果包含在源文本中的【和】之間,有的例子會(huì)使用Java來(lái)實(shí)現(xiàn),如果是java本身正則表達(dá)式的用法,會(huì)在相應(yīng)的地方說(shuō)明。所有java例子都在JDK1.6.0_13下測(cè)試通過(guò)。
一、匹配多個(gè)字符中的某一個(gè)
在上一篇《正則表達(dá)式教程之匹配單個(gè)字符詳解》中的一個(gè)匹配以na或sa開(kāi)頭的文本文件例子中,使用的正則表達(dá)式是.a.\.txt。如果還有一個(gè)文件是cal.txt,那么也將會(huì)被匹配到。如果只想要匹配na或sa開(kāi)頭的文件,該怎么辦呢?
既然只想找出n或s,使用可以匹配任何字符的.顯然是不行的。在正則表達(dá)式中,我們可以使用[和]來(lái)定義一個(gè)字符集合,在使用[和]來(lái)定義的字符集合里,這兩個(gè)元字符之間的所有字符都是該集合的組成部分,字符集合的匹配結(jié)果是能夠與該集合里的任何一個(gè)成員相匹配的的文本。
來(lái)看一個(gè)和上一篇相似一個(gè)例子:
文本:
sales.txt
na1.txt
na2.txt
sa1.txt
sanatxt.txt
cal.txt
正則表達(dá)式:[ns]a.\.txt
結(jié)果:
sales.txt
【na1.txt】
【na2.txt】
【sa1.txt】
sanatxt.txt
cal.txt
分析:這里使用的正則表達(dá)式是以[na]開(kāi)頭,這個(gè)集合將匹配字符n或s,不會(huì)匹配其他任何字符。[和]不匹配任何字符,它們只負(fù)責(zé)定義一個(gè)字符集合。接下來(lái)a匹配一個(gè)字符a,\.將匹配一個(gè).字符本身,txt匹配txt字符本身,匹配結(jié)果與我們預(yù)期的一致。
但是,如果文件中如果有一個(gè)文件是usa1.txt,那么它也會(huì)被匹配出來(lái)。這是位置匹配的問(wèn)題,在后面將會(huì)討論到。
二、使用字符集合區(qū)間
上面的例子中,如果我們只想匹配以na或sa開(kāi)頭,后面跟一個(gè)數(shù)字的文件怎么辦?正則表達(dá)式[ns]a.\.txt中,.將會(huì)匹配到任意一個(gè)字符,包括數(shù)字。這個(gè)問(wèn)題可以使用字符集合來(lái)解決:
sales.txt
na1.txt
na2.txt
sa1.txt
san.txt
sanatxt.txt
cal.txt
正則表達(dá)式:[ns]a[0123456789]\.txt
結(jié)果:
sales.txt
【na1.txt】
【na2.txt】
【sa1.txt】
san.txt
sanatxt.txt
cal.txt
分析:從結(jié)果可以看到,我們只匹配出來(lái)以na或sa開(kāi)頭,后面跟一個(gè)數(shù)字的文件,而san.txt沒(méi)有被匹配出來(lái),因?yàn)槭褂昧俗址蟍0123456789]來(lái)限定第三個(gè)字符只能是數(shù)字。
在正則表達(dá)式中,會(huì)很頻繁的使用到一些字符區(qū)間,比如0-9,a-z等等,為了簡(jiǎn)化字符區(qū)間的定義,正則表達(dá)式提供了一個(gè)特殊的元字符-來(lái)定義字符區(qū)間。像上面這個(gè)例子,我們可以使用正則表達(dá)式來(lái)匹配:[ns]a[0-9]\.txt,結(jié)果與上面完全一樣。
字符區(qū)間不僅限于數(shù)字,像下面這些都是合法的字符區(qū)間:
[A-F]:匹配從A到F的所有大寫(xiě)字母。
[A-Z]:匹配從A到Z的所有大寫(xiě)字母。
[A-z]:匹配從ASCII字符A到ASCII字符z的所有字母。但這個(gè)區(qū)間一般不會(huì)用到,只是舉例說(shuō)明。因?yàn)樗鼈冎g還包含著[和^等在ASCII中排列在Z和a之間的字符。
字符區(qū)間的首尾字符可以是ASCII字符列表中的任意字符。但在實(shí)際使用中,最常用的還是數(shù)字和字母字符區(qū)間。
注意:在定義字符區(qū)間的時(shí)候,不能讓區(qū)間的尾字符小于首字符(如[9-0]),這是不允許的。-作為元字符只能出現(xiàn)在[和]之間,如果在[和]之外的任何地方,它只是一個(gè)普通的字符,只會(huì)與-本身匹配。
在同一個(gè)字符集合中可以給出多個(gè)字符區(qū)間,比如:[0-9a-zA-Z]將匹配任意一個(gè)大小寫(xiě)字母和數(shù)字。
來(lái)看一下匹配網(wǎng)頁(yè)中顏色的例子:
文本:
span style="background-color:#3636FF;height:30px; width:60px;">測(cè)試/span>
正則表達(dá)式:#[0-9A-Fa-f] [0-9A-Fa-f] [0-9A-Fa-f] [0-9A-Fa-f] [0-9A-Fa-f] [0-9A-Fa-f]
結(jié)果:span style="background-color:【#3636FF】;height:30px; width:60px;">測(cè)試/span>
分析:在網(wǎng)頁(yè)中,顏色一般表示為一個(gè)以#開(kāi)頭的RGB值,R代表紅色,G代表綠色,B代表藍(lán)色,任何一種顏色都可以通過(guò)RGB的不同組合調(diào)和出來(lái)。RGB值用16進(jìn)值表示,如#000000代表白色,#FFFFFF代表黑色,#FF0000代表紅色。所以網(wǎng)頁(yè)中匹配顏色的正則表達(dá)式是以#開(kāi)頭,后面跟6個(gè)相同的[0-9A-Fa-f]字符集合(這可以簡(jiǎn)寫(xiě)成#[0-9A-Fa-f]{6},會(huì)在后面的重復(fù)匹配中討論到)。
三、取非匹配
字符集合通常用來(lái)指定一組必須匹配其中之一的字符,但在某些場(chǎng)合,我們需要反過(guò)來(lái)做,給出一組不需要得到的字符,換句話說(shuō),除了在那個(gè)字符集合中的字符,其他的任意字符都可以匹配。
比如,要匹配以na或sa開(kāi)頭,后面跟的不是數(shù)字的文件:
文本:
sales.txt
na1.txt
na2.txt
sa1.txt
sanatxt.txt
san.txt
正則表達(dá)式:[ns]a[^0-9]\.txt
結(jié)果:
sales.txt
na1.txt
na2.txt
sa1.txt
sanatxt.txt
【san.txt】
分析:這個(gè)例子使用的模式正好與前面的相反,前面[0-9]只匹配數(shù)字,而這里[^0-9]匹配的是非數(shù)字。
注意:^在[和]之間表示取非,如果出現(xiàn)在正則表達(dá)式的開(kāi)頭,表示位置匹配匹配了,這將在后面討論到。同時(shí),^的效果將作用于給定字符集合里的所有字符或字符區(qū)間,而不僅限于緊跟在^字符后面的那一個(gè)字符或字符區(qū)間。如[^0-9a-z]表示不匹配任何數(shù)字或小寫(xiě)字母。
四、小結(jié)
元字符[和]用于定義一個(gè)字符集合,其含義是必須與該集合里的字符之一匹配。定義一個(gè)字符集合的方法有兩種:一是把所有的字符都列舉出來(lái);二是利用元字符-以字符區(qū)間的方式給出。字符集合可以使用元字符^來(lái)取非,這將把給定的字符集合強(qiáng)行排除在匹配操作外,除了該字符集合里的字符,其他字符都可以匹配。
在接下來(lái)的文章中,我們將會(huì)討論正則表達(dá)式中的一些元字符的使用。
PS:這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用:
JavaScript正則表達(dá)式在線測(cè)試工具:
http://tools.jb51.net/regex/javascript
正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg
希望本文所述對(duì)大家正則表達(dá)式學(xué)習(xí)有所幫助。
您可能感興趣的文章:- 正則表達(dá)式匹配用戶密碼
- Javascript校驗(yàn)密碼復(fù)雜度的正則表達(dá)式
- 手機(jī)號(hào)碼,密碼正則驗(yàn)證
- php password密碼驗(yàn)證正則表達(dá)式(8位長(zhǎng)度限制)
- js正則實(shí)現(xiàn)的密碼框簡(jiǎn)單制作,還可以替換成自己想用得符號(hào)
- 密碼強(qiáng)度檢測(cè)函數(shù)(正則)
- 正則表達(dá)式教程之位置匹配詳解
- 正則表達(dá)式教程之重復(fù)匹配詳解
- 正則表達(dá)式教程之匹配單個(gè)字符詳解
- JS正則匹配中文的方法示例
- 正則匹配密碼只能是數(shù)字和字母組合字符串功能【php與js實(shí)現(xiàn)】