主頁(yè) > 知識(shí)庫(kù) > pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn)

pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn)

熱門標(biāo)簽:千呼ai電話機(jī)器人免費(fèi) 外呼系統(tǒng)前面有錄音播放嗎 高德地圖標(biāo)注字母 騰訊地圖標(biāo)注有什么版本 400電話辦理費(fèi)用收費(fèi) 鎮(zhèn)江人工外呼系統(tǒng)供應(yīng)商 深圳網(wǎng)絡(luò)外呼系統(tǒng)代理商 柳州正規(guī)電銷機(jī)器人收費(fèi) 申請(qǐng)辦個(gè)400電話號(hào)碼

本文主要介紹了pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn),分享給大家,具體如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印數(shù)據(jù)框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重復(fù)項(xiàng)
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 統(tǒng)計(jì)重復(fù)值
dup=df[df.duplicated()].count()
print(dup) # 最后兩項(xiàng)重復(fù)
# data1  2
# key1   2
# key2   2

# 去除重復(fù)項(xiàng)
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重復(fù)元素個(gè)數(shù)的獲取

方法有二:

1. 在調(diào)用duplicated方法后,非重復(fù)的元素會(huì)被標(biāo)記為False,而重復(fù)的元素會(huì)被標(biāo)記為True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info為一個(gè)dataframe框,user_id為其中一列

【注2】duplicated( )方法只會(huì)把重復(fù)的元素標(biāo)記為True,而不會(huì)標(biāo)記被重復(fù)的元素

2.這行代碼的速度更快,drop_duplicates(['user_id'])方法為刪除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 為獲取行數(shù)

到此這篇關(guān)于pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)pandas統(tǒng)計(jì)重復(fù)值次數(shù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Pandas 數(shù)據(jù)處理,數(shù)據(jù)清洗詳解
  • Pandas統(tǒng)計(jì)重復(fù)的列里面的值方法
  • pandas數(shù)據(jù)處理基礎(chǔ)之篩選指定行或者指定列的數(shù)據(jù)
  • Python Pandas數(shù)據(jù)分析工具用法實(shí)例
  • Python教程pandas數(shù)據(jù)分析去重復(fù)值

標(biāo)簽:郴州 烏蘭察布 海南 合肥 哈爾濱 烏蘭察布 大慶 平頂山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn)》,本文關(guān)鍵詞  pandas,統(tǒng)計(jì),重復(fù),值,次數(shù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn)》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章