主頁(yè) > 知識(shí)庫(kù) > python中文本字符處理的簡(jiǎn)單方法記錄

python中文本字符處理的簡(jiǎn)單方法記錄

熱門標(biāo)簽:Win7旗艦版 企業(yè)做大做強(qiáng) 硅谷的囚徒呼叫中心 呼叫中心市場(chǎng)需求 客戶服務(wù) 語(yǔ)音系統(tǒng) 百度AI接口 電話運(yùn)營(yíng)中心

今天,跟大家分享一下我做小項(xiàng)目時(shí)想出來(lái)的文本字符處理的方法,希望能對(duì)大家有所幫助。

完整代碼:

strings = "我,是‘C|S;D|N!的:程【序】員#M,r.;P'a#n?_學(xué)?狂"#將字符串設(shè)置好

def String_Process(string):#定義一個(gè)字符處理函數(shù),設(shè)置參數(shù)string,是有待處理的字符串。
 print("python使我快樂??!")
 print("未處理的字符串:",string)
 varchar = '‘'“”:#,!【】,#|?|,;;?:"'#人為設(shè)定字符集合
 ls = []#定義一個(gè)列表用于存儲(chǔ)拆散的字符
 for s in string:
  ls.append(s)#將字符串拆散存進(jìn)列表中
 for element in ls:
  if element in varchar:#如果在字符集合內(nèi)發(fā)現(xiàn),則從列表中刪除
   ls.remove(element)
 String = ''#定義字符串
 for l in ls:#將列表中拆散的元素組合回去。
  String = String+l
 print("處理后的字符串:",String)#得到處理結(jié)果
String_Process(string=strings)#調(diào)用函數(shù),傳入實(shí)參給形參。

運(yùn)行結(jié)果,如下圖:

對(duì)于處理文本字符的思想在代碼中已經(jīng)說明,關(guān)于代碼的解釋在注釋中也寫出了。我們把它通過函數(shù)進(jìn)行封裝,當(dāng)我們需要處理文本字符的時(shí)候,通過調(diào)用函數(shù)就可以實(shí)現(xiàn)文本字符處理了。當(dāng)然,調(diào)用函數(shù)處理字符時(shí)需要得到string返回值以及注釋掉print,因?yàn)槲覀內(nèi)绻窃谘h(huán)中調(diào)用,沒必要全部打印一遍,影響視覺對(duì)文本的分析。即修改代碼如下圖:

對(duì)于上面的文本處理代碼,我又做了一次更新,可以增加新的字符或者是字符串來(lái)更新字符集合,更加方便處理文本中的字符。

改進(jìn)后的代碼,如下圖:

strings = "我,是‘C|S;D|N!的:程【序】員#M,r.;②P'「(a#n」?_學(xué)?狂..."#將字符串設(shè)置好

def Process(string):#定義一個(gè)字符處理函數(shù),設(shè)置參數(shù)string,是有待處理的字符串。
  print("python使我快樂?。?)
  print("未處理的字符串:",string)
  varchar = '‘'“”:#,!【】,#|?|,;;?:"'#人為設(shè)定字符集合
  var_ls = []
  for var in varchar:
    var_ls.append(var)
  print("這是當(dāng)前的字符集合:",var_ls)
  while True:
    want = str(input("是否需要增加新的字符/字符集合?(yes or no)"))
    if want == 'yes':
      add_varchar = str(input("請(qǐng)輸入需要增加的新字符/字符集合:"))
      for var in add_varchar:
        var_ls.append(var)
      print("更新后的字符集合:",var_ls)
    elif want == 'no':
      break
    else:
      print("輸入有誤?。≌?qǐng)重試??!")
      continue

  ls = []#定義一個(gè)列表用于存儲(chǔ)拆散的字符
  for s in string:
    ls.append(s)#將字符串拆散存進(jìn)列表中
  for element in ls[:]:
    if element in var_ls:#如果在字符集合內(nèi)發(fā)現(xiàn),則從列表中刪除
      ls.remove(element)
    elif element not in var_ls:
      continue
  String = ''#定義字符串
  for l in ls:#將列表中拆散的元素組合回去。
     String = String+l
  print("處理后的字符串:",String)#得到處理結(jié)果
Process(string=strings)#調(diào)用函數(shù),傳入實(shí)參給形參。

代碼的解釋在注釋中寫了,大家如果對(duì)代碼不理解可以和我私信探討。

運(yùn)行結(jié)果,如下圖:

總結(jié)

到此這篇關(guān)于python中文本字符處理的文章就介紹到這了,更多相關(guān)python文本字符處理內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python統(tǒng)計(jì)文本字符串里單詞出現(xiàn)頻率的方法
  • Python實(shí)現(xiàn)簡(jiǎn)單文本字符串處理的方法
  • Python處理文本文件中控制字符的方法
  • 使用Python提取文本中含有特定字符串的方法示例
  • 解決Python對(duì)齊文本字符串問題
  • Python cookbook(字符串與文本)針對(duì)任意多的分隔符拆分字符串操作示例
  • Python cookbook(字符串與文本)在字符串的開頭或結(jié)尾處進(jìn)行文本匹配操作
  • Python字符串及文本模式方法詳解

標(biāo)簽:喀什 濟(jì)南 海南 山西 山西 長(zhǎng)沙 崇左 安康

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python中文本字符處理的簡(jiǎn)單方法記錄》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266