主頁 > 知識庫 > 一篇文章搞懂Python反斜杠的相關(guān)問題

一篇文章搞懂Python反斜杠的相關(guān)問題

熱門標(biāo)簽:Win7旗艦版 電話運(yùn)營中心 客戶服務(wù) 呼叫中心市場需求 硅谷的囚徒呼叫中心 語音系統(tǒng) 百度AI接口 企業(yè)做大做強(qiáng)

大家在開發(fā)Python的過程中,一定會遇到很多反斜杠的問題,很多人被反斜杠的數(shù)量搞得頭大。

首先我們寫一段非常簡單的Python代碼,它的作用是把一個(gè)字段先轉(zhuǎn)換為JSON格式的字符串,然后把這個(gè)字符串再轉(zhuǎn)換為JSON格式的字符串:

import json
 
info = {'name': 'kingname', 'address': '杭州', 'salary': 99999}
info_json = json.dumps(info)
 
# 第一次轉(zhuǎn)換以后,打印出來
print(info_json)
 
info_json_json = json.dumps(info_json)
 
# 第二次轉(zhuǎn)換以后,再打印出來
print(info_json_json)

它的運(yùn)行效果如下圖所示。

第一次,字典轉(zhuǎn)成JSON格式的字符串,只有中文杭州變成了Unicode編碼\u676d\u5dde,其余地方?jīng)]有出現(xiàn)反斜杠。

在Python里面,反斜杠不能單獨(dú)出現(xiàn),這里\u676d\u5dde中的兩根反斜杠,實(shí)際上應(yīng)該是\u。表示這兩個(gè)編碼是Unicode編碼。

接下來,把第一次生成的JSON字符串:{"name": "kingname", "address": "\u676d\u5dde", "salary": 99999}再一次轉(zhuǎn)成JSON格式的字符串,這一次變成了:

"{\"name\": \"kingname\", \"address\": \"\\u676d\\u5dde\", \"salary\": 99999}"

為什么突然出現(xiàn)了這么多反斜杠?這是因?yàn)?,JSON格式的字符串本身是使用雙引號來表示字符串的。如果原來的字符串里面本身就有雙引號,那就會導(dǎo)致混淆。此時(shí),Python需要把原來字符串的雙引號變成普通的字符,失去雙引號的作用。因此使用\"讓雙引號變成普通的字符。

這就相當(dāng)于在Python中,可以這樣定義一個(gè)包含雙引號的字符串:

>>> a = "跟我說:\"你好\""
>>> print(a)
跟我說:"你好"

這里,你好兩側(cè)的雙引號都加上了反斜杠,讓它成為普通的字符,防止它們提前與最外層的雙引號配對。

如果不加反斜杠,就會導(dǎo)致字符串里面的雙引號提前與外層的雙引號配對,引起語法錯(cuò)誤:

>>> b = "跟我說:"你好""
  File "stdin>", line 1
    b = "跟我說:"你好""
               ^
SyntaxError: invalid syntax

這里,"跟我說:"成為了一個(gè)字符串,末尾的""成為了一個(gè)空字符串。那么中間的你好就變成了一個(gè)沒有定義的變量。而Python里面,是不存在字符串未定義的變量字符串這種寫法的,所以會報(bào)語法錯(cuò)誤。

而JSON格式的字符串,本質(zhì)上也是字符串,所以自然而然也需要遵循這樣的規(guī)則。因此,字符串原來自帶的雙引號左側(cè)就被加上了反斜杠。

那么,原來的\u676d\u5dde為什么變成了\\u676d\\u5dde?

這是因?yàn)?,?dāng)?shù)诙螆?zhí)行json.dumps的時(shí)候,傳入的參數(shù)是一個(gè)JSON格式的字符串,本質(zhì)就是字符串。而一個(gè)字符串里面如果自帶反斜杠,那么JSON在對他再次轉(zhuǎn)換的時(shí)候,需要標(biāo)記這是一個(gè)普通的字符串形式的反斜杠,不是一個(gè)有特殊意義的反斜杠,所以使用\\表示一個(gè)普通的反斜杠。

好了,那么你可以猜一下,如果把info_json_jsonjson.dumps一下會怎么樣?

會變成:

"\"{\\\"name\\\": \\\"kingname\\\", \\\"address\\\": \\\"\\\\u676d\\\\u5dde\\\", \\\"salary\\\": 99999}\""

為什么出現(xiàn)了三個(gè)反斜杠連用和四個(gè)反斜杠連用的問題?

實(shí)際上非常簡單,當(dāng)你對info_json_json執(zhí)行json.dumps的時(shí)候,Python是怎么轉(zhuǎn)換的?

我們來看:

"{\"name\": \"kingname\", \"address\": \"\\u676d\\u5dde\", \"salary\": 99999}"

字符串執(zhí)行json.dumps的時(shí)候,記住一個(gè)關(guān)鍵方法——從左到右,一個(gè)字符一個(gè)字符的轉(zhuǎn)換。

1. 第一個(gè)字符是雙引號,所以變成\"
2. 第二個(gè)字符是{,不是特殊符號,保留
3. 第三個(gè)字符是\,把它變成\\
4. 第四個(gè)字符是",把它變成\"
5. ……

全部執(zhí)行完成了,由于這次轉(zhuǎn)換是把一個(gè)字符串轉(zhuǎn)換為JSON格式的字符串,所以最外側(cè)加上雙引號。

于是就得到了:

"\"{\\\"name\\\": \\\"kingname\\\", \\\"address\\\": \\\"\\\\u676d\\\\u5dde\\\", \\\"salary\\\": 99999}\""

我們在爬蟲開發(fā)過程中,可能會遇到上面這種經(jīng)過多次JSON轉(zhuǎn)換后的字符串,此時(shí),千萬不要輕易使用字符串的.replace方法把多個(gè)反斜杠替換為空或者把兩個(gè)反斜杠替換為一個(gè)反斜杠。那樣做只會導(dǎo)致你的數(shù)據(jù)更難解析。

正確的做法應(yīng)該是嘗試對數(shù)據(jù)一層一層使用json.loads,把它一層一層還原,還原到最初的{'name': 'kingname', 'address': '杭州', 'salary': 99999}這種簡單形式。

好了,今天的介紹就到這里,最后留一個(gè)思考題:

還是上面的代碼,現(xiàn)在把PyCharm的調(diào)試模式打開,然后數(shù)一數(shù)info_jsoninfo_json_json里面反斜杠的個(gè)數(shù),如下圖所示:

為什么在info_json里面,出現(xiàn)了\\u676d\\u5dde,為什么在info_json_json里面雙引號前是兩根反斜杠,而\"\\u676d\\u5dde\"竟然變成了\\"\\\\u676d\\\\u5dde。

總結(jié)

到此這篇關(guān)于一篇文章搞懂Python反斜杠的文章就介紹到這了,更多相關(guān)Python反斜杠內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python 正則表達(dá)式 反斜杠(/)的麻煩和陷阱
  • Python中正反斜杠(‘/’和‘\’)的意義與用法
  • 詳解Python中的正斜杠與反斜杠
  • Python中的左斜杠、右斜杠(正斜杠和反斜杠)
  • Python字符串和正則表達(dá)式中的反斜杠(''\'')問題詳解
  • python如何輸出反斜杠
  • 使用Python解決Windows文件名非用反斜杠問題(python 小技巧)
  • Python3.6-MySql中插入文件路徑,丟失反斜杠的解決方法
  • 解決Python正則表達(dá)式匹配反斜杠''''''''問題
  • python中的反斜杠問題深入講解

標(biāo)簽:海南 安康 濟(jì)南 崇左 長沙 山西 喀什 山西

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《一篇文章搞懂Python反斜杠的相關(guān)問題》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266