chinese乱子伦XXXXHD,最新精品在线视频,欧美特级特黄AAAAAA片不卡

主頁 > 知識庫 > Python re.sub 反向引用的實現(xiàn)

Python re.sub 反向引用的實現(xiàn)

match 分組

Python re 模塊中提供了 match 函數(shù)，用來匹配字符串中指定的正則表達式規(guī)則。例如，如果想匹配到 "Isaac Newton, physicist" 中的 Isaac Newton，則可以使用正則表達式 \w+ \w+ ，運行結(jié)果如下：

>>> m = re.match("\w+ \w+", "Isaac Newton, physicist")
>>> m
re.Match object; span=(0, 12), match='Isaac Newton'>

re.match 的第一個參數(shù)是指定的正則表達式規(guī)則，第二個參數(shù)是待匹配的字符串。正則表達式規(guī)則 \w+ 表示匹配一段連續(xù)的字符，要求匹配到的字符數(shù)量大于 1。 \w+ \w+ 就表示匹配兩段連續(xù)的字符，且兩段字符中間用空格隔開

使用 match 執(zhí)行匹配時會對匹配到的結(jié)果進行分組，可以通過 match 返回結(jié)果的 group() 接口查看分組結(jié)果

>>> m.group(0)
'Isaac Newton'

默認情況下， match 只會產(chǎn)生一個分組，就是第 0 個分組，表示整個匹配到的內(nèi)容。對于上面的例子，第 0 個分組就是 \w+ \w+ 匹配到的完整的內(nèi)容，也就是 Issac Newton 。
使用正則表達式中的括號 () 可以手動指定匹配的分組。例如如果想把 Issac 和 Newton 做為兩個分組，那么可以將正則表達式改為 (\w+) (\w+) ：

>>> m = re.match("(\w+) (\w+)", "Isaac Newton, physicist")

在 (\w+) (\w+) 這個正則表達式中，指定了兩個分組，這兩個分組匹配的內(nèi)容都是 \w+ ，并且兩個分組之間用空格隔開。
使用 groups() 可以查看匹配結(jié)果中的所有分組：

>>> m.groups()
('Isaac', 'Newton')

也可以使用 group() 接口分別查看每一個分組，其中 group(0) 仍然表示完整的匹配結(jié)果， group(1) 表示匹配結(jié)果中的第 1 個分組， group(2) 表示第 2 個分組，以此類推：

>>> m.group(0)
'Isaac Newton'
>>> m.group(1)
'Isaac'
>>> m.group(2)
'Newton'

re.sub 匹配和替換

re.match() 函數(shù)提供了正則表達式的匹配接口， re.sub() 不光能匹配正則表達式，還能替換字符串中的結(jié)果，生成一個新的字符串。
例如把字符串中 (\w+) (\w+) 匹配到的結(jié)果替換成 Albert Einstein ，可以這樣寫：

>>> re.sub("(\w+) (\w+)", "Albert Einstein", "Isaac Newton, physicist")
'Albert Einstein, physicist'

re.sub 中第 1 個參數(shù)表示匹配的正則表達式，第 2 個參數(shù)表示替換表達式，第 3 個參數(shù)表示原始字符串

這里的替換表達式是手動指定的新字符串 Albert Einstein ，他和原始字符串中的內(nèi)容毫不相關(guān)。如果希望復(fù)用原始字符串中的內(nèi)容，那么就需要用到 re.sub 的反向引用功能了。

反向引用

反向引用指的是在指定替換結(jié)果的過程中，可以引用原始字符串中的匹配到內(nèi)容。例如 (\w+) (\w+) 在原始字符串中匹配到了 Isaac Newton ，利用匹配到的結(jié)果，將結(jié)果改寫為 FirstName: Isaac, LastName: Newton 。
既然需要引用，那么就得有一個表達式能夠表示匹配的內(nèi)容。恰好 re.sub 的匹配結(jié)果也有和 re.match 一樣的分組，因此只需要在替換表達式中引用分組的結(jié)果即可。引用方式有以下幾種：

\number ：例如 \1 ，表示匹配結(jié)果中第 1 個分組，也就是例子中的 Isaac 部分。
\gnumber> ：例如 \g1> ，和 \number 表示法一樣，也代表了匹配結(jié)果中的第 1 個分組。與 \number 表示法相比， \gnumber> 避免了歧義。試想，如果想用 \number 把第 1 個分組匹配到的 Isaac 替換為 Isaac0 ，那么需要用 \10 ，這里本意表示在第 1 個分組后加上 0 ，但程序會識別成第 10 個分組。而使用 \gnumber> 只需要寫成 \g1>0 即可。

回到開始的例子中，將匹配結(jié)果 Isaac Newton改寫為 FirstName: Isaac, LastName: Newton ，可以用以下表達式實現(xiàn)：

>>> re.sub("(\w+) (\w+)", "FirstName: \g1>, LastName: \g2>", "Isaac Newton, physicist")
'FirstName: Isaac, LastName: Newton, physicist'

參考

re — Regular expression operations
Python re(gex)? -- Groupings and backreferences

到此這篇關(guān)于Python re.sub 反向引用的實現(xiàn)的文章就介紹到這了,更多相關(guān)Python re.sub 反向引用內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

用Python代碼自動生成文獻的IEEE引用格式的實現(xiàn)
淺析Python模塊之間的相互引用問題
python3爬蟲中引用Queue的實例講解
python閉包與引用以及需要注意的陷阱
詳解python如何引用包package
python 引用傳遞和值傳遞詳解(實參,形參)
Python參數(shù)傳遞機制傳值和傳引用原理詳解
Python參數(shù)傳遞對象的引用原理解析
python實現(xiàn)引用其他路徑包里面的模塊
python關(guān)于多級包之間的引用問題

標簽：宜昌湖北佳木斯上饒珠海潮州西寧盤錦

巨人網(wǎng)絡(luò)通訊聲明：本文標題《Python re.sub 反向引用的實現(xiàn)》，本文關(guān)鍵詞 Python,re.sub,反向,引,用的,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。

Python re.sub 反向引用的實現(xiàn)

目錄

match 分組

re.sub 匹配和替換

反向引用

參考