主頁 > 知識庫 > ASP獲取網(wǎng)頁全部圖片地址并保存為數(shù)組的正則

ASP獲取網(wǎng)頁全部圖片地址并保存為數(shù)組的正則

熱門標(biāo)簽:Linux服務(wù)器 阿里云 Mysql連接數(shù)設(shè)置 電子圍欄 服務(wù)器配置 團(tuán)購網(wǎng)站 銀行業(yè)務(wù) 科大訊飛語音識別系統(tǒng)
目前還是有BUG的,最新的測試頁面在: http://www.reallydo.com/getimg.asp
正則分析頁面在: http://jorkin.reallydo.com/article.asp?id=380 
發(fā)現(xiàn)BUG請?jiān)诤竺媪粞?謝謝.
1.31修正
src=后面有空格不能正確匹配.已修正.
src=''為空時(shí)出錯(cuò).已修正.
發(fā)現(xiàn)BUG: 圖片路徑有多個(gè)空格時(shí)只能保留一個(gè).未修正.
2.18修正
圖片路徑有多個(gè)空格時(shí)只能保留一個(gè)的BUG.已修正.
復(fù)制代碼 代碼如下:


'功能:獲取全部圖片地址,保存到一個(gè)數(shù)組. 
'來源:http://jorkin.reallydo.com/article.asp?id=448 
'需要ReplaceAll函數(shù):http://jorkin.reallydo.com/article.asp?id=406 

Function getIMG(sString) 
    Dim sReallyDo, regEx, iReallyDo 
    Dim oMatches, cMatch 
    '//定義一個(gè)空數(shù)組 
    iReallyDo = -1 
    ReDim aReallyDo(iReallyDo) 
    If IsNull(sString) Then 
        getIMG = "" 
        Exit Function 
    End If 
    '//格式化HTML代碼 
    '//將每個(gè) img 換行 方便正則替換 
    sReallyDo = sString 
    On Error Resume Next 
    sReallyDo = Replace(sReallyDo, vbCr, " ") 
    sReallyDo = Replace(sReallyDo, vbLf, " ") 
    sReallyDo = Replace(sReallyDo, vbTab, " ") 
    sReallyDo = Replace(sReallyDo, "img ", vbCrLf  "img ", 1, -1, 1) 
    sReallyDo = Replace(sReallyDo, "/>", " />", 1, -1, 1) 
    sReallyDo = ReplaceAll(sReallyDo, "= ", "=", True) 
    sReallyDo = ReplaceAll(sReallyDo, "> ", ">", True) 
    sReallyDo = Replace(sReallyDo, ">", ">"  vbCrLf  "") 
    sReallyDo = Trim(sReallyDo) 
    On Error GoTo 0 
    Set regEx = New RegExp 
    regEx.IgnoreCase = True 
    regEx.Global = True 
    '//去除onclick,onload等腳本 
    regEx.Pattern = "\s[on].+?=([\""|\'])(.*?)1" 
    sReallyDo = regEx.Replace(sReallyDo, "") 
    '//將SRC不帶引號的圖片地址加上引號 
    regEx.Pattern = "img.*?ssrc=([^\""\'\s][^\""\'\s>]*).*?>" 
    sReallyDo = regEx.Replace(sReallyDo, "img src=""$1"" />") 
    '//正則匹配圖片SRC地址 
    regEx.Pattern = "img.*?ssrc=([\""\'])([^\""\']+?)1.*?>" 
    Set oMatches = regEx.Execute(sReallyDo) 
    '//將圖片地址存入數(shù)組 
    For Each cMatch in oMatches 
        iReallyDo = iReallyDo + 1 
        ReDim Preserve aReallyDo(iReallyDo) 
        aReallyDo(iReallyDo) = regEx.Replace(cMatch.Value, "$2") 
    Next 
    getIMG = aReallyDo 
End Function 
%> 

標(biāo)簽:衢州 棗莊 江蘇 萍鄉(xiāng) 大理 衡水 廣元 蚌埠

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《ASP獲取網(wǎng)頁全部圖片地址并保存為數(shù)組的正則》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266