主頁 > 知識庫 > 關(guān)于 ASR 技術(shù)應(yīng)用于自助語音系統(tǒng)的可行性探討

關(guān)于 ASR 技術(shù)應(yīng)用于自助語音系統(tǒng)的可行性探討

熱門標(biāo)簽:機器人外呼系統(tǒng)軟件 電話銷售團(tuán)隊 運營中心 人工座席 電話外呼服務(wù) 語音營銷系統(tǒng) 阿里云 電銷團(tuán)隊

一、呼叫中心自助語音系統(tǒng)的起源與現(xiàn)狀

呼叫中心是基于現(xiàn)代通訊技術(shù)來處理大量各種不同的電話呼入和呼出業(yè)務(wù)與服務(wù)的系統(tǒng)。其最初的模型是基于PSTN的呼叫中心,是最早發(fā)展起來的呼叫中心,簡稱CC(Ca11Center),業(yè)務(wù)代表通過接聽電話為客戶提供信息服務(wù),此時尚未與Internet網(wǎng)絡(luò)集成在一起,由專業(yè)的話務(wù)員根據(jù)自己的經(jīng)驗和記憶力為打入電話的顧客進(jìn)行咨詢服務(wù),由于是憑人工記憶,信息容量有限,服務(wù)能力也無法提高。為了使電話系統(tǒng)為用戶提供更好的服務(wù),CTI技術(shù)應(yīng)孕而生。

CTI技術(shù)是指計算機電信集成Computer Telecommunication Integration)技術(shù),將計算機技術(shù)應(yīng)用到電話系統(tǒng)中,能夠自動地對電話中的指令信息進(jìn)行識別處理,通過建立有關(guān)的話路連接而向用戶傳送預(yù)定的文件、轉(zhuǎn)接電話,并且能夠處理傳真、電子郵件等其它形式的信息媒體

現(xiàn)代的呼叫中心應(yīng)用了CTI技術(shù),通過相關(guān)的軟件處理使計算機也能夠處理電話的聲音及有關(guān)的信令信息,也可以提供自動語音應(yīng)答(IVR)、自動呼叫轉(zhuǎn)移(ACD)、語音信箱等業(yè)務(wù)功能。這其中IVR(Interaction Voice Response,交互式語音應(yīng)答)是呼叫中心產(chǎn)品鏈的重要組成部分,實現(xiàn)了呼叫中心的7*24小時服務(wù),為企業(yè)處理大量的日常業(yè)務(wù)。

客戶通過按鍵或語音選擇來輸入相關(guān)信息,在允許范圍內(nèi)訪問各類企業(yè)數(shù)據(jù)庫(通過ODBC),自助得到多種服務(wù),令業(yè)務(wù)代表有更多的時間服務(wù)于有特別要求的顧客。IVR的文本與語音合成(Text-to-speech Synthesis)技術(shù)以事先錄制好的清晰的聲音為客戶服務(wù),同時也可根據(jù)服務(wù)地區(qū)用不同語言播放語音提示或咨詢信息,但這種通過電話按鍵進(jìn)行交互的自動呼叫系統(tǒng)在一次服務(wù)中客戶往往需要反復(fù)選擇按鍵多次,十分不便,如果可以采用自動語音識別方式將用戶的語音直接轉(zhuǎn)換成計算機能自動處理的文本信息則可以令呼叫中心的服務(wù)更加自動化、人性化。特別是在如今人工智能高速發(fā)展,在Torque和小冰、小娜、siri等智能機器人相繼出現(xiàn)的情況下,我們的電話銀行自助語音系統(tǒng)是否可以再進(jìn)一步發(fā)展?

二、ASP技術(shù)介紹

自動語音識別(Automatic Speech Recognition,簡稱ASR)系統(tǒng)是一種可以識別講話者語音的軟件系統(tǒng),通過語音信號處理和模式識別而將語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本,其目的是讓計算機自動識別和理解人類口訴的語言。

識別的原理:語音輸入后首先進(jìn)行語音識別,包括對單詞(句)、音節(jié)和音素等的選取,進(jìn)行特征提取,去除語音中對識別無關(guān)緊要的冗余信息,對確認(rèn)的語音特征進(jìn)行模擬訓(xùn)練,建立語音識別所需的模板。而計算機要根據(jù)語音識別的模型將計算機中存放的語音模板與待識別的語音信號進(jìn)行比較、匹配,找出最優(yōu)的與輸入語音匹配的模板。然后根據(jù)此模板的定義就可以給出計算機的識別結(jié)果(如圖1)。

1 語音識別流程

隨著社會的進(jìn)步,人工智能Artificial Intelligence)的理論和技術(shù)日益成熟,應(yīng)用領(lǐng)域也不斷擴大,可以設(shè)想未來人工智能帶來的科技產(chǎn)品將會是人類智慧容器”。

2009 年時 Google 便已經(jīng)利用語音識別技術(shù)在 YouTube上提供實時的自動字幕(Automatic Captions)”功能,讓客戶可以在避免干擾到他人的前提上在不開啟喇叭的狀況下觀賞網(wǎng)絡(luò)上各種影片內(nèi)容,YouTube則利用Google的自動語音識別技術(shù)(ASR)給YouTube視頻加入字幕。

而在國內(nèi),支付寶中引入的語音機器人并非簡單地通過語音識別搜索商品或信息,而是進(jìn)化到深層次語義理解的層面,能夠一步處理多層維度的信息。比如在支付寶上方搜索欄點擊右側(cè)的小話筒圖標(biāo)啟動智能語音機器人,發(fā)起向某朋友轉(zhuǎn)賬1000元的語音指令,其中包含的朋友名字對應(yīng)的賬戶、轉(zhuǎn)賬功能、金額1000元”三個信息要素,能夠在不足一秒即刻直接跳轉(zhuǎn)至最終功能頁,只需要點擊轉(zhuǎn)賬確認(rèn)、輸入密碼即可完成,而以往則需要用戶分四步操作近10秒才能到達(dá)上述環(huán)節(jié)。

三、ASP技術(shù)是否可以應(yīng)用于呼叫中心自助語音系統(tǒng)?

1、ASP技術(shù)與傳統(tǒng)自助語音結(jié)合的必要性

案例一:

電影《Her》中,男主角Theodore在情感低落期愛上了操作系統(tǒng)薩曼莎,其實Theodore會喜歡上操作系統(tǒng)一點兒也不奇怪,試想這世界突然有這么一個它”是專屬的、私密的、忠誠的,讓你能放下防備,毫無負(fù)擔(dān)地袒露脆弱、孤獨和彷徨,而這個它”又如此聰慧地理解你的喜怒哀樂,恰如其分地安慰你、鼓勵你、滿足你。如果呼叫中心是那個它”,你是否會接受它”的陪伴?但實際上在和Theodore溝通的同時薩曼莎總共有8316位人類交互對象,而且與其中的641位發(fā)生了愛情,而Theodore只是其中一位。試想如果是薩曼莎是一個人,那她只能為一人服務(wù),但是薩曼莎是操作系統(tǒng),這恰好反映了計算機的強大、反應(yīng)迅速,如同呼叫中心,一位人工座席只能為一位客戶提供服務(wù),而如果是完善的電話銀行語音系統(tǒng)卻可以同時向大量客戶提供更多的服務(wù)。

案例二:

筆者所在的運營小組曾經(jīng)對七個工作日的全組接聽量13440通電話進(jìn)行電話銀行信用卡客戶業(yè)務(wù)偏好分析,結(jié)果顯示大量的信用卡客戶通過電話銀行主要辦理查還款金額、調(diào)額、查可用額度和辦理分期付款業(yè)務(wù)(如表1)。

1 電話銀行信用卡業(yè)務(wù)列表

但這些業(yè)務(wù)真的必要通過人工座席查詢、辦理嗎?是否可以通過電話銀行語音系統(tǒng)自助辦理?

呼叫中心作為企業(yè)與客戶的紐帶,建立功能完善的呼叫中心是增強企業(yè)競爭力的重要手段之一。

在呼叫中心將ASR技術(shù)應(yīng)用于自助語音,實現(xiàn)了具有語音識別功能的IVR系統(tǒng),通過直接的語言輸入就可以操作計算機系統(tǒng),該技術(shù)不僅不會受到電話機按鍵的限制,簡化了客戶操作;同時還可以使IVR流程的功能大大增強,從而擴大傳統(tǒng)IVR的使用范圍。

電話接通后系統(tǒng)自動播放提示音,客戶根據(jù)提示音作出相應(yīng)回答即可,系統(tǒng)記錄客戶語音,交由自動語音識別軟件處理,通過數(shù)據(jù)庫信息比對之后,系統(tǒng)自動輸出確認(rèn)信息。例如客戶需要對20161215消費5000元進(jìn)行分期付款一年期,按照現(xiàn)在的電話銀行業(yè)務(wù)處理僅可以通過人工服務(wù)辦理??蛻魮芡娫捄笸ㄟ^自助語音系統(tǒng)輸入證件號碼/卡號+密碼,通過層層語音菜單報讀后選擇分期付款人工服務(wù),此階段將近2分鐘,進(jìn)入人工服務(wù)后業(yè)務(wù)代表根據(jù)流程辦理分期付款,此階段大約需要3分鐘,整個分期付款過程需要耗時5分鐘左右。而對于應(yīng)用ASR技術(shù)的自助語音,IVR系統(tǒng)可以達(dá)到直接辦理分期付款的功能,客戶可以在撥通電話后口訴需求:20161215消費1000元分期付款一年,經(jīng)過模版庫匹配后語音自動進(jìn)行身份核實,為客戶辦理此筆交易的分期付款。整個業(yè)務(wù)辦理過程簡單明了,并且計算機也可以同時為多位客戶辦理不同業(yè)務(wù)。

通過語音來輸入用戶請求,實現(xiàn)用戶與系統(tǒng)的互動,將語音識別技術(shù)運用到IVR系統(tǒng)中,這無疑將大大提高IVR系統(tǒng)對于呼叫中心的作用,更加堅定了呼叫中心在企業(yè)中的價值。

2、ASP技術(shù)與傳統(tǒng)自助語音結(jié)合的優(yōu)勢

反應(yīng)迅速:根據(jù)蘋果siri、微軟Cortana的表現(xiàn)顯示語音輸入后會在秒級得到響應(yīng),這種速度遠(yuǎn)遠(yuǎn)超過人工客服,應(yīng)用ASR技術(shù)的電話銀行自助語音完全能夠代替一部分人的功能或者提高人的效率,提高呼叫中心工作效率,并且可以給用戶帶來良好的使用體驗。

成本更低:現(xiàn)在呼叫中心的運營成本一般包括人力成本、場地成本、IT成本等,其中人力成本的占比最大,高達(dá)75%,在呼叫中心的運營過程中如何控制”人的支出成為了關(guān)鍵,但實際上如果實現(xiàn)更加便捷的自助語音服務(wù)自然就可以降低人力成本,同時也可以為人工客服帶來更多分流,緩解呼叫中心流失率較大的尷尬。

改變習(xí)慣:現(xiàn)在很多客戶在撥通客服電話后會直接選擇人工服務(wù),甚至在語音提示人工座席忙時仍一直等待接通人工,而客戶愿意等待人工服務(wù)的原因大多是因為主觀地認(rèn)為自助服務(wù)無法解決問題,如果電話銀行語音系統(tǒng)能夠優(yōu)化到能更加快捷地解決問題,那么客戶也會通過優(yōu)化后的語音來辦理業(yè)務(wù),從而改變自己的行為習(xí)慣

業(yè)務(wù)拓展:現(xiàn)在的電話銀行人工一般受理咨詢、查詢、業(yè)務(wù)辦理、投訴、建議等,而語音系統(tǒng)僅能受理簡單的咨詢、查詢,如果利用優(yōu)化后的語音系統(tǒng)可以受理更多業(yè)務(wù)如大量咨詢、查詢,簡單的業(yè)務(wù)辦理等,未來的電話銀行自助語音系統(tǒng)將可以獨立完成業(yè)務(wù)辦理。

3、面臨的問題

1)應(yīng)用ASR的自助語音系統(tǒng)后在語音中可以進(jìn)行相關(guān)知識匹配,進(jìn)行業(yè)務(wù)處理,但這一切需要對應(yīng)一個強大的模版庫以及細(xì)化后的專業(yè)知識,那么前期的知識整理工作將會非常繁重。

2)根據(jù)呼叫中心服務(wù)地區(qū)的不同,客戶的意圖分類以及關(guān)鍵詞的設(shè)定及語音識別單元的整個選取過程較為復(fù)雜。

3)隨著企業(yè)長期運營,知識的新增、變更以及過期刪除都需要投入大量的人力維護(hù)以確保提供知識的準(zhǔn)確有效性。

4、未來的展望

改善服務(wù),改善經(jīng)營,使呼叫中心服務(wù)質(zhì)量和利潤雙雙上升,可以說這樣一個新的完整的呼叫中心已為電子商務(wù)構(gòu)架了完美的模式,它將肯定會成為電子商務(wù)的主題、平臺、核心和靈魂。

ASR技術(shù)與呼叫中心的結(jié)合以及語音數(shù)據(jù)、視頻信號的多媒體技術(shù)的集成將使呼叫中心在功能上有一個飛躍,創(chuàng)造出不同新概念、新功能的呼叫中心,使它在未來信息通信領(lǐng)域中將占有越來越重要的地位,這些新模式的呼叫中心將會成為電子商務(wù)的主體和新的平臺,這些全新概念的呼叫中心將成為未來電子商務(wù)的核心和靈魂。

標(biāo)簽:晉中 雅安 福建 常德 黔西 黔東 楚雄 貴港

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《關(guān)于 ASR 技術(shù)應(yīng)用于自助語音系統(tǒng)的可行性探討》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《關(guān)于 ASR 技術(shù)應(yīng)用于自助語音系統(tǒng)的可行性探討》相關(guān)的同類信息!
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266