AV五月天激情在线,亚洲高清专区日韩精品,亚洲精品乱码久久久久久蜜桃不卡

主頁 > 知識(shí)庫 > Python爬蟲正則表達(dá)式常用符號(hào)和方法

Python爬蟲正則表達(dá)式常用符號(hào)和方法

正則表達(dá)式并不是Python的一部分。正則表達(dá)式是用于處理字符串的強(qiáng)大工具，擁有自己獨(dú)特的語法以及一個(gè)獨(dú)立的處理引擎，效率上可能不如str自帶的方法，但功能十分強(qiáng)大。得益于這一點(diǎn)，在提供了正則表達(dá)式的語言里，正則表達(dá)式的語法都是一樣的，區(qū)別只在于不同的編程語言實(shí)現(xiàn)支持的語法數(shù)量不同；但不用擔(dān)心，不被支持的語法通常是不常用的部分。

1、常用符號(hào)

. ：匹配任意字符，換行符 \n 除外

：匹配前一個(gè)字符0次或無限次
? ：匹配前一個(gè)字符0次或1次

.* ：貪心算法，盡可能的匹配多的字符

.*? ：非貪心算法

() ：括號(hào)內(nèi)的數(shù)據(jù)作為結(jié)果返回

2、常用方法

findall：匹配所有符合規(guī)律的內(nèi)容，返回包含結(jié)果的列表

Search：匹配并提取第一個(gè)符合規(guī)律的內(nèi)容，返回一個(gè)正則表達(dá)式對(duì)象

Sub：替換符合規(guī)律的內(nèi)容，返回替換后的值

3、使用示例

（1）. 的使用舉例，匹配任意字符，換行符 \n 除外

import re #導(dǎo)入re庫文件

a = 'xy123'

b = re.findall('x..',a)

print b

打印的結(jié)果為：['xy1'] ，每個(gè) . 表示一個(gè)占位符

（2） * 的使用舉例，匹配前一個(gè)字符0次或無限次

a = 'xyxy123'

b = re.findall('x*',a)

print b

打印的結(jié)果為：['x', '', 'x', '', '', '', '', '']

（3） ? 的使用舉例，匹配前一個(gè)字符0次或1次

a = 'xy123'

b = re.findall('x?',a)

print b

打印的結(jié)果為：['x', '', '', '', '', '']

（4） .* 的使用舉例

secret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'

b = re.findall('xx.*xx',secret_code)

print b

打印的結(jié)果為：['xxIxxfasdjifja134xxlovexx23345sdfxxyouxx']

（5）.*？的使用舉例

secret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'

c = re.findall('xx.*?xx',secret_code)

print c

打印的結(jié)果為：['xxIxx', 'xxlovexx', 'xxyouxx']

（6） ()的使用舉例

secret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'

d = re.findall('xx(.*?)xx',secret_code)

print d

打印的結(jié)果為：['I', 'love', 'you'] ，括號(hào)內(nèi)的數(shù)據(jù)作為返回的結(jié)果

（7） re.S的使用舉例

s = '''sdfxxhello

xxfsdfxxworldxxasdf'''

d = re.findall('xx(.*?)xx',s,re.S)

print d

打印的結(jié)果為：['hello\n', 'world'] ，re.S的作用是使 . 在匹配時(shí)包括 \n

（8） findall的使用舉例

s2 = 'asdfxxIxx123xxlovexxdfd'

f2 = re.findall('xx(. ?)xx123xx(. ?)xx',s2)

print f20

打印的結(jié)果為：love

這時(shí)f2為含有一個(gè)元組的列表，該元組包含兩個(gè)元素，該元組中的兩個(gè)元素為兩個(gè)()匹配到的內(nèi)容，如果s2包含多個(gè)'xx(. ?)xx123xx(. ?)xx'這樣的子串，則f2包含多個(gè)元組；

（9） search的使用舉例

s2 = 'asdfxxIxx123xxlovexxdfd'

f = re.search('xx(. ?)xx123xx(. ?)xx',s2).group(2)

print f

打印的結(jié)果為：love

.group(2) 表示返回第二個(gè)括號(hào)匹配到的內(nèi)容，如果是 .group(1), 則打印的就是：I

（10）sub的使用舉例

s = '123rrrrr123'

output = re.sub('123(.*?)123','123%d123'%789,s)

print output

打印的結(jié)果為：123789123

其中的%d類似于C語言中的%d，如果 output=re.sub('123(.*?)123','123789123',s)，輸出結(jié)果也為： 123789123

（11） \d 的使用舉例，用于匹配數(shù)字

a = 'asdfasf1234567fasd555fas'

b = re.findall('(\d+)',a)

print b

打印的結(jié)果為：['1234567', '555'] ， \d+ 可以匹配數(shù)字字符串；

以上就是python爬蟲正則表達(dá)式的一些常用符號(hào)和語法，希望對(duì)python初學(xué)者學(xué)習(xí)有所幫助。

您可能感興趣的文章:

零基礎(chǔ)寫python爬蟲之神器正則表達(dá)式
Python的爬蟲包Beautiful Soup中用正則表達(dá)式來搜索
python3爬蟲之入門基礎(chǔ)和正則表達(dá)式
python爬蟲正則表達(dá)式使用技巧及爬取個(gè)人博客的實(shí)例講解
python爬蟲正則表達(dá)式之處理換行符
玩轉(zhuǎn)python爬蟲之正則表達(dá)式
Python爬蟲之正則表達(dá)式基本用法實(shí)例分析
Python 爬蟲學(xué)習(xí)筆記之正則表達(dá)式
Python爬蟲之正則表達(dá)式的使用教程詳解
Python爬蟲教程之利用正則表達(dá)式匹配網(wǎng)頁內(nèi)容

標(biāo)簽：咸陽三亞綿陽池州梅州六安鞍山恩施

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《Python爬蟲正則表達(dá)式常用符號(hào)和方法》，本文關(guān)鍵詞 Python,爬蟲,正則,表達(dá)式,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。