主頁 > 知識庫 > 正則表達式

正則表達式

熱門標簽:電子圍欄 科大訊飛語音識別系統(tǒng) 阿里云 銀行業(yè)務 團購網(wǎng)站 Mysql連接數(shù)設(shè)置 Linux服務器 服務器配置
我們要解析一個HTML文檔時可利用正則表達式取得標簽內(nèi)容
例子:
以從字符串中取出所有A標簽的 id號和內(nèi)容為例:
a id="1" target="_blank">aaaaaaaaaa/a>
正則表達式:
a[^]*id[^]*=[^]*"(?ID>[^]*)"[^]*target[^]*=[^]*"[^]*_blank[^]*" [^]*>(?content>[^]*)/a>
正則分解:
[^]* 是一個很有用的組合,能定位到下一個查詢關(guān)鍵字
(?ID>[^]*)  用于取得一個或者多個值直到遇到下一個關(guān)鍵字
ID> 類似一個正則的變量,給用()號取得的內(nèi)容進行標識,以便于程序的調(diào)用
C#調(diào)用的例子:
string strRegex=@"a[^]*id[^]*=[^]*"(?ID>[^]*)"[^]*target[^]*=[^]*"[^]*_blank[^]*" [^]*>(?CONTENT>[^]*)/a>";
string strSource="a id=\"1\" target=\"_blank\">aaaaaaaaaa/a>"
System.Text.RegularExpressions.Regex r;
                System.Text.RegularExpressions.MatchCollection m;
                mc= new System.Text.RegularExpressions.Regex(strRegex, System.Text.RegularExpressions.RegexOptions.IgnoreCase);
               ro = mc.Matches(strSource);
if (ro.Count >= 0)
 {
   for (int i = 0; i  m.Count; i++)
    {
        //取出ID和內(nèi)容
         string id = ro[i].Groups["ID"].Value;
         string topic = ro[i].Groups["CONTENT"].Value;
    }
 }

標簽:江蘇 衡水 棗莊 蚌埠 衢州 大理 萍鄉(xiāng) 廣元

巨人網(wǎng)絡(luò)通訊聲明:本文標題《正則表達式》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266