主頁 > 知識(shí)庫 > Java正則表達(dá)式入門學(xué)習(xí)

Java正則表達(dá)式入門學(xué)習(xí)

熱門標(biāo)簽:團(tuán)購網(wǎng)站 科大訊飛語音識(shí)別系統(tǒng) Mysql連接數(shù)設(shè)置 Linux服務(wù)器 銀行業(yè)務(wù) 阿里云 電子圍欄 服務(wù)器配置

許多語言,包括Perl、PHP、Python、JavaScript和JScript,都支持用正則表達(dá)式處理文本,一些文本編輯器用正則表達(dá)式實(shí)現(xiàn)高級(jí)“搜索-替換”功能。所以JAVA語言也不例外。正則表達(dá)式已經(jīng)超出了某種語言或某個(gè)系統(tǒng)的局限,成為被人們廣為使用的工具,我們完全可以用它來解決實(shí)際開發(fā)中碰到的一些實(shí)際的問題。

一、正則表達(dá)式基礎(chǔ)知識(shí)
1.1 句點(diǎn)符號(hào)
假設(shè)你在玩英文拼字游戲,想要找出三個(gè)字母的單詞,而且這些單詞必須以“t”字母開頭,以“n”字母結(jié)束。另外,假設(shè)有一本英文字典,你可以用正則表達(dá)式搜索它的全部內(nèi)容。要構(gòu)造出這個(gè)正則表達(dá)式,你可以使用一個(gè)通配符——句點(diǎn)符號(hào)“.”。這樣,完整的表達(dá)式就是“t.n”,它匹配“tan”、“ten”、“tin”和“ton”,還匹配“t#n”、“tpn”甚至“t n”,還有其他許多無意義的組合。這是因?yàn)榫潼c(diǎn)符號(hào)匹配所有字符,包括空格、Tab字符甚至換行符:
1.2 方括號(hào)符號(hào)
為了解決句點(diǎn)符號(hào)匹配范圍過于廣泛這一問題,你可以在方括號(hào)(“[]”)里面指定看來有意義的字符。此時(shí),只有方括號(hào)里面指定的字符才參與匹配。也就是說,正則表達(dá)式“t[aeio]n”只匹配“tan”、“Ten”、“tin”和“ton”。但“Toon”不匹配,因?yàn)樵诜嚼ㄌ?hào)之內(nèi)你只能匹配單個(gè)字符:
1.3 “或”符號(hào)
如果除了上面匹配的所有單詞之外,你還想要匹配“toon”,那么,你可以使用“|”操作符?!皘”操作符的基本意義就是“或”運(yùn)算。要匹配“toon”,使用“t(a|e|i|o|oo)n”正則表達(dá)式。這里不能使用方擴(kuò)號(hào),因?yàn)榉嚼ㄌ?hào)只允許匹配單個(gè)字符;這里必須使用圓括號(hào)“()”。圓括號(hào)還可以用來分組。
1.4 表示匹配次數(shù)的符號(hào)
下表顯示了正則表達(dá)式的語法:

表 1.1 正則表達(dá)式語法

假設(shè)我們要在文本文件中搜索美國的社會(huì)安全號(hào)碼。這個(gè)號(hào)碼的格式是999-99-9999。用來匹配它的正則表達(dá)式如圖一所示。在正則表達(dá)式中,連字符(“-”)有著特殊的意義,它表示一個(gè)范圍,比如從0到9。因此,匹配社會(huì)安全號(hào)碼中的連字符號(hào)時(shí),它的前面要加上一個(gè)轉(zhuǎn)義字符“/”。

假設(shè)進(jìn)行搜索的時(shí)候,你希望連字符號(hào)可以出現(xiàn),也可以不出現(xiàn)——即,999-99-9999和999999999都屬于正確的格式。這時(shí),你可以在連字符號(hào)后面加上“?”數(shù)量限定符號(hào)。

美國汽車牌照的一種格式是四個(gè)數(shù)字加上二個(gè)字母。它的正則表達(dá)式前面是數(shù)字部分“[0-9]{4}”,再加上字母部分“[A-Z]{2}”。
1.5 “否”符號(hào)
“^”符號(hào)稱為“否”符號(hào)。如果用在方括號(hào)內(nèi),“^”表示不想要匹配的字符。例如,圖四的正則表達(dá)式匹配所有單詞,但以“X”字母開頭的單詞除外。
1.6 圓括號(hào)和空白符號(hào)
 “/s”符號(hào)是空白符號(hào),匹配所有的空白字符,包括Tab字符。如果字符串正確匹配,接下來如何提取出月份部分呢?只需在月份周圍加上一個(gè)圓括號(hào)創(chuàng)建一個(gè)組,然后用ORO API提取出它的值。
1.7 其它符號(hào)
為簡(jiǎn)便起見,你可以使用一些為常見正則表達(dá)式創(chuàng)建的快捷符號(hào)。如以下所示:
/t:制表符,等同于/u0009
/n:換行符,等同于/u000A
/d:代表一個(gè)數(shù)字,等同于[0-9]
/D:代表非數(shù)字,等同于[^0-9]
/s:代表換行符、Tab制表符等空白字符
/S:代表非空白字符
/w:字母字符,等同于[a-zA-Z_0-9]
/W:非字母字符,等同于[^/w]
例如,在前面社會(huì)安全號(hào)碼的例子中,所有出現(xiàn)“[0-9]”的地方我們都可以使用“/d”。
二、以下是我整理出來的程序,供參考:

package org.luosijin.test; 
 
import java.util.regex.Matcher; 
import java.util.regex.Pattern; 
public class Regex { 
 public static void main(String[] args) { 
  Pattern pattern = Pattern.compile("b*g"); 
  Matcher matcher = pattern.matcher("bbg"); 
  System.out.println(matcher.matches()); 
  System.out.println(pattern.matches("b*g","bbg")); 
  //驗(yàn)證郵政編碼 
  System.out.println(pattern.matches("[0-9]{6}", "200038")); 
  System.out.println(pattern.matches("http://d{6}", "200038")); 
  //驗(yàn)證電話號(hào)碼 
  System.out.println(pattern.matches("[0-9]{3,4}//-?[0-9]+", "02178989799")); 
  getDate("Nov 10,2009"); 
  charReplace(); 
  //驗(yàn)證身份證:判斷一個(gè)字符串是不是身份證號(hào)碼,即是否是15或18位數(shù)字。 
  System.out.println(pattern.matches("^//d{15}|//d{18}$", "123456789009876")); 
  getString("D:/dir1/test.txt"); 
  getChinese("welcome to china,江西奉新,welcome,你!"); 
  validateEmail("luosijin123@163.com"); 
 } 
 /** 
  * 日期提取:提取出月份來 
  */ 
 public static void getDate(String str){ 
  String regEx="([a-zA-Z]+)|//s+[0-9]{1,2},//s*[0-9]{4}"; 
  Pattern pattern = Pattern.compile(regEx); 
  Matcher matcher = pattern.matcher(str); 
  if(!matcher.find()){ 
   System.out.println("日期格式錯(cuò)誤!"); 
   return; 
  } 
  System.out.println(matcher.group(1)); //分組的索引值是從1開始的,所以取第一個(gè)分組的方法是m.group(1)而不是m.group(0)。 
 } 
 /** 
  * 字符替換:本實(shí)例為將一個(gè)字符串中所有包含一個(gè)或多個(gè)連續(xù)的“a”的地方都替換成“A”。 
  */ 
 public static void charReplace(){ 
  String regex = "a+"; 
  Pattern pattern = Pattern.compile(regex); 
  Matcher matcher = pattern.matcher("okaaaa LetmeAseeaaa aa booa"); 
  String s = matcher.replaceAll("A"); 
  System.out.println(s); 
 } 
 /** 
  * 字符串提取 
  */ 
 public static void getString(String str){ 
  String regex = ".+/(.+)$"; 
  Pattern pattern = Pattern.compile(regex); 
  Matcher matcher = pattern.matcher(str); 
  if(!matcher.find()){ 
   System.out.println("文件路徑格式不正確!"); 
   return; 
  } 
  System.out.println(matcher.group(1)); 
 } 
 /** 
  * 中文提取 
  * @param str 
  * @author 羅嗣金 
  * @date 2009-11-10 上午12:27:17 
  */ 
 public static void getChinese(String str){ 
  String regex = "[//u4E00-//u9FFF]+";//[//u4E00-//u9FFF]為漢字 
  Pattern pattern = Pattern.compile(regex); 
  Matcher matcher = pattern.matcher(str); 
  StringBuffer sb = new StringBuffer(); 
  while(matcher.find()){ 
   sb.append(matcher.group()); 
  } 
  System.out.println(sb); 
 } 
  public static void validateEmail(String email){ 
  String regex = "[0-9a-zA-Z]+@[0-9a-zA-Z]+//.[0-9a-zA-Z]+"; 
  Pattern pattern = Pattern.compile(regex); 
  Matcher matcher = pattern.matcher(email); 
  if(matcher.matches()){ 
   System.out.println("這是合法的Email"); 
  }else{ 
   System.out.println("這是非法的Email"); 
  } 
 } 
} 

 以上就是Java正則表達(dá)式的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助

您可能感興趣的文章:
  • java正則表達(dá)式四種常用的處理方式(匹配、分割、替代、獲取)
  • 實(shí)例解析Java程序中正則表達(dá)式的貪婪模式匹配
  • Java編程中正則表達(dá)式的用法總結(jié)
  • java常用正則表達(dá)式
  • java正則表達(dá)式學(xué)習(xí)筆記之命名捕獲
  • Java正則表達(dá)式提取字符的方法實(shí)例
  • Java正則表達(dá)式易錯(cuò)知識(shí)點(diǎn)匯總
  • 學(xué)習(xí)Java正則表達(dá)式(匹配、替換、查找)
  • 詳解Java正則表達(dá)式語法
  • Java正則表達(dá)式匹配電話格式
  • Java用正則表達(dá)式如何讀取網(wǎng)頁內(nèi)容
  • Java 正則表達(dá)式詳細(xì)介紹

標(biāo)簽:廣元 衢州 萍鄉(xiāng) 大理 棗莊 蚌埠 江蘇 衡水

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Java正則表達(dá)式入門學(xué)習(xí)》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266