久久精品国产福利国产秒拍,欧美日本国产VA高清CABAL,国产精品黄色片

主頁 > 知識庫 > Python爬蟲實戰(zhàn)之爬取攜程評論

Python爬蟲實戰(zhàn)之爬取攜程評論

一、分析數(shù)據(jù)源

這里的數(shù)據(jù)源是指html網(wǎng)頁？還是Aajx異步。對于爬蟲初學者來說，可能不知道怎么判斷，這里辰哥也手把手過一遍。

提示：以下操作均不需要登錄（當然登錄也可以）

咱們先在瀏覽器里面搜索攜程，然后在攜程里面任意搜索一個景點：長隆野生動物世界，這里就以長隆野生動物世界為例，講解如何去爬取攜程評論數(shù)據(jù)。

頁面下方則是評論數(shù)據(jù)

從上面兩張圖可以看出，點擊評論下一頁，瀏覽器的鏈接沒有變化，說明數(shù)據(jù)是Ajax異步請求。因此我們就找到了數(shù)據(jù)是異步加載過來的，這時候需要去network里面是查看數(shù)據(jù)包。

二、分析數(shù)據(jù)包

在network中找到下面這個數(shù)據(jù)包

查看Preview里面的內(nèi)容（請求返回內(nèi)容）

可以看到數(shù)據(jù)已經(jīng)請求到了，下面看一下數(shù)據(jù)是否是正確的（和網(wǎng)頁內(nèi)容一致）。

ok，沒問題之后，下面開始編寫Python程序去請求數(shù)據(jù)。

1.請求地址

可以獲取到請求鏈接和請求方式。

這里請求不用添加請求頭header也是可以的。其中postUrl是請求鏈接，data_1是請求參數(shù)。

2.請求參數(shù)

在network里可以看到請求參數(shù)

在程序中的構(gòu)建如下：

其中需要關(guān)注的是arg中的pageIndex（頁數(shù)），pageSize（每頁條數(shù)）。

最終結(jié)果如下：

該景點的評論就可以成功爬取下來了。

三、采集全部評論

上面只是采集了第一頁的評論數(shù)據(jù)，通過改變arg中的pageIndex（頁數(shù)），就可以遍歷爬取全部的評論。

比如這個景點一共是300頁。現(xiàn)在把循環(huán)給加上

最終的完整代碼如下：

到此這篇關(guān)于Python爬蟲實戰(zhàn)之爬取攜程評論的文章就介紹到這了,更多相關(guān)Python爬取攜程評論內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

python 爬取吉首大學網(wǎng)站成績單
python趣味挑戰(zhàn)之爬取天氣與微博熱搜并自動發(fā)給微信好友
python 爬取影視網(wǎng)站下載鏈接
Python爬蟲之爬取我愛我家二手房數(shù)據(jù)
python 爬取京東指定商品評論并進行情感分析
python結(jié)合多線程爬取英雄聯(lián)盟皮膚(原理分析)
python爬取豆瓣電影TOP250數(shù)據(jù)
python爬取鏈家二手房的數(shù)據(jù)
教你怎么用python爬取愛奇藝熱門電影
Python爬蟲之爬取最新更新的小說網(wǎng)站

標簽：酒泉江蘇寧夏商丘金融催收云南定西龍巖

巨人網(wǎng)絡(luò)通訊聲明：本文標題《Python爬蟲實戰(zhàn)之爬取攜程評論》，本文關(guān)鍵詞 Python,爬蟲,實戰(zhàn),之爬,取,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。