国产亚洲精品国产第一,国产精品丝袜久久久久一区

主頁(yè) > 知識(shí)庫(kù) > Python獲取百度熱搜的完整代碼

Python獲取百度熱搜的完整代碼

好久沒(méi)寫(xiě)了，就把上課做的一個(gè)小東西拿出來(lái)分享一下吧。
百度網(wǎng)頁(yè)截圖如下 ↓↓↓

程序運(yùn)行輸出結(jié)果截圖 ↓↓↓

上代碼 ↓↓↓

from lxml import etree
from lxml import html
import requests

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36'}
page = requests.get("https://www.baidu.com",headers=headers)
html = page.text
#print(source1)
# 從字符串解析
element = etree.HTML(html)

# 元素列表，獲取的方式列出了如下兩種
# ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')
ps = element.xpath('//*[@class="title-content-title"]')

#熱搜文本內(nèi)容
text = []
if len(ps) > 0:
  for p in ps:
    #輸出節(jié)點(diǎn)的文本
    text1 = p.text
    text.append(text1)
else:
  print("空")
  
x = element.xpath('//*[@class="s-hotsearch-content"]/li')

#熱搜文本對(duì)應(yīng)的排名
index = []
for x1 in x:
  #獲取節(jié)點(diǎn)的屬性
  index1 = x1.get("data-index")
  index.append(index1)

print(text)  
print(index)

#定義一個(gè)對(duì)文本和排名進(jìn)行匹配的函數(shù)，返回一個(gè)字典型數(shù)據(jù)
def PP(index_array,text_array):
  x = {}
  i = 0
  for index_a in index_array:
    #index_a = int(index_a)
    
    x[index_a] = text_array[i]
    i = i + 1
  return x

re_text = PP(index,text)
#對(duì)字典性數(shù)據(jù)按key進(jìn)行排序，即key=lambda re:re[0]，排序完成后再轉(zhuǎn)換為字典型數(shù)據(jù)
last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此這篇關(guān)于Python獲取百度熱搜的完整代碼的文章就介紹到這了,更多相關(guān)Python 百度熱搜內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

Python爬蟲(chóng)爬取微博熱搜保存為 Markdown 文件的源碼
Python爬蟲(chóng)分析微博熱搜關(guān)鍵詞的實(shí)現(xiàn)代碼
如何用python爬取微博熱搜數(shù)據(jù)并保存
python+selenium爬取微博熱搜存入Mysql的實(shí)現(xiàn)方法
Python網(wǎng)絡(luò)爬蟲(chóng)之爬取微博熱搜

標(biāo)簽：畢節(jié) 呼和浩特湖州駐馬店衡水股票中山江蘇

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《Python獲取百度熱搜的完整代碼》，本文關(guān)鍵詞 Python,獲取,百度,熱搜,的,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無(wú)關(guān)。

Python獲取百度熱搜的完整代碼

四合一精品企业网站建设

¥888元限时抢购

立即咨询快速购买

企业400电话

合计11份范本：公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议