А∨天堂在线中文免费不卡,亚洲免费图区在线视频,亚洲国产精品成人久久青草

主頁(yè) > 知識(shí)庫(kù) > 利用Python3實(shí)現(xiàn)統(tǒng)計(jì)大量單詞中各字母出現(xiàn)的次數(shù)和頻率的方法

利用Python3實(shí)現(xiàn)統(tǒng)計(jì)大量單詞中各字母出現(xiàn)的次數(shù)和頻率的方法

首先以只讀方式打開單詞文件，利用列表推導(dǎo)式創(chuàng)建兩個(gè)列表
列表sta記錄各單詞出現(xiàn)的次數(shù)，列表freq記錄各單詞出現(xiàn)的頻率

f = open('5500詞.txt','r',encoding='utf-8')
sta = [0 for i in range(26)]
freq = [0 for i in range(26)]

單詞格式如下所示：
a [ei] art.一(個(gè))；每一(個(gè))；(同類事物中)任一個(gè)
abandon [ə'bændən] vt.離棄，丟棄；遺棄，拋棄；放棄
abdomen [æb'dəumen] n.腹，下腹(胸部到腿部的部分)
abatement [ə'beitmənt] n.減(免)稅，打折扣，沖銷
abide [ə'baid] vi.(abode，abided)(by)遵守；堅(jiān)持；vt.忍受，容忍

每行一個(gè)單詞，所以我們選擇按行讀取文件

for i in range(5500):
  buf = f.readline()

然后依次統(tǒng)計(jì)每個(gè)字符串中的字母?jìng)€(gè)數(shù)，注意大寫字母也要統(tǒng)計(jì)（后面的字母省略）

for j in buf:
    if j == 'a' or j == 'A':
      sta[0] = sta[0] + 1
    elif j == 'b' or j == 'B':
      sta[1] = sta[1] + 1

注意到每個(gè)單詞后都有音標(biāo)，所以遇到中括號(hào)" [ "時(shí)停止計(jì)數(shù)

if j == '[':
      break

然后每五個(gè)一行，依次輸出各個(gè)單詞出現(xiàn)的次數(shù)，將print函數(shù)中的end參數(shù)由默認(rèn)換行改成幾個(gè)空格，使輸出更格式化。字母利用ASCII碼輸出

print('5498個(gè)詞匯中，各字母出現(xiàn)的次數(shù)分別為：\n')
asc = 97
for i in range(26):
  if i  25:
    print("%c" % asc,':',sta[i],end='  ')
    if (i + 1) % 5 == 0:
      print('\n')
  else:
    print("%c" % asc,':',sta[i])
  asc = asc + 1

利用一個(gè)for遍歷計(jì)算出所有字母數(shù)量的總和

sum = 0
for i in sta:
  sum = sum + i

利用一個(gè)for遍歷計(jì)算出各字母出現(xiàn)的頻率，注意到Python中計(jì)算出的頻率會(huì)自動(dòng)保留17位小數(shù)，為了方便查看，使用round()函數(shù)保留四位小數(shù)，值得注意的是，使用round()函數(shù)會(huì)自動(dòng)去掉數(shù)字末尾的0

for i in range(26):
  freq[i] = round(sta[i] / sum,4)

再以每五個(gè)一行，依次輸出各個(gè)單詞出現(xiàn)的頻率，將print函數(shù)中的end參數(shù)由默認(rèn)換行改成幾個(gè)空格，使輸出更格式化。字母利用ASCII碼輸出。

print('各字母出現(xiàn)的頻率分別為：\n')
for i in range(26):
  if i  25:
    print("%c" % asc,':',freq[i],end='  ')
    if (i + 1) % 5 == 0:
      print('\n')
  else:
    print("%c" % asc,':',freq[i])
  asc = asc + 1

最后輸出的結(jié)果如下圖所示：

上概率論的課時(shí)，偶然看見居然有人拿著詞典去數(shù)字母的數(shù)量，就想能不能寫一個(gè)自動(dòng)統(tǒng)計(jì)的程序，于是就隨便寫著玩。代碼功底很差，所以寫得很丑（居然有25個(gè)elif），所以看個(gè)樂呵就好了。

總的來說，我覺得有這些可以改進(jìn)的地方：
①讀取單詞的方法可以改進(jìn)，這種一行一行讀取的方式，對(duì)格式要求很高，很難找到
②用字典來存儲(chǔ)頻數(shù)和頻率是否會(huì)更好？后面輸出的時(shí)候可以避免使用ASCII碼，但是字典推導(dǎo)式我屬實(shí)記不清了
③判斷計(jì)數(shù)的這些if和elif能否抽象出一個(gè)方法？增加代碼復(fù)用
④round()函數(shù)會(huì)自動(dòng)去掉小數(shù)后面的0，有沒有什么方法使0被保留下來？這樣輸出的格式會(huì)更好看

我的代碼的優(yōu)點(diǎn)估計(jì)只有一點(diǎn)了：
①Python初學(xué)者就能看懂

到此這篇關(guān)于利用Python3實(shí)現(xiàn)統(tǒng)計(jì)大量單詞中各字母出現(xiàn)的次數(shù)和頻率的方法的文章就介紹到這了,更多相關(guān)Python3字母出現(xiàn)次數(shù)和頻率內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

Python 統(tǒng)計(jì)數(shù)據(jù)集標(biāo)簽的類別及數(shù)目操作
Python統(tǒng)計(jì)可散列的對(duì)象之容器Counter詳解
Python 統(tǒng)計(jì)列表中重復(fù)元素的個(gè)數(shù)并返回其索引值的實(shí)現(xiàn)方法
Python實(shí)戰(zhàn)之單詞打卡統(tǒng)計(jì)
python之cur.fetchall與cur.fetchone提取數(shù)據(jù)并統(tǒng)計(jì)處理操作
python自動(dòng)統(tǒng)計(jì)zabbix系統(tǒng)監(jiān)控覆蓋率的示例代碼
python 統(tǒng)計(jì)代碼耗時(shí)的幾種方法分享
Python統(tǒng)計(jì)列表元素出現(xiàn)次數(shù)的方法示例
python統(tǒng)計(jì)RGB圖片某像素的個(gè)數(shù)案例
Python jieba 中文分詞與詞頻統(tǒng)計(jì)的操作
使用Python 統(tǒng)計(jì)文件夾內(nèi)所有pdf頁(yè)數(shù)的小工具
python 統(tǒng)計(jì)list中各個(gè)元素出現(xiàn)的次數(shù)的幾種方法
python調(diào)用百度AI接口實(shí)現(xiàn)人流量統(tǒng)計(jì)
Python代碼覆蓋率統(tǒng)計(jì)工具coverage.py用法詳解
python 爬蟲基本使用——統(tǒng)計(jì)杭電oj題目正確率并排序
利用python匯總統(tǒng)計(jì)多張Excel
python統(tǒng)計(jì)mysql數(shù)據(jù)量變化并調(diào)用接口告警的示例代碼
用python實(shí)現(xiàn)監(jiān)控視頻人數(shù)統(tǒng)計(jì)

標(biāo)簽：石家莊西寧文山錫林郭勒盟昆明梅州浙江懷化

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《利用Python3實(shí)現(xiàn)統(tǒng)計(jì)大量單詞中各字母出現(xiàn)的次數(shù)和頻率的方法》，本文關(guān)鍵詞利用,Python3,實(shí)現(xiàn),統(tǒng)計(jì),大量,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。