說到這兩樣產(chǎn)品,相信電銷公司對這兩個(gè)產(chǎn)品都不陌生吧。智能外呼、智能客服功能繁多,系統(tǒng)設(shè)計(jì)復(fù)雜,這里也只能是想到哪,寫到哪。簡單地將系統(tǒng)歸類一下,整個(gè)系統(tǒng)圍繞著通話的三條線展開(兩個(gè)終端和一個(gè)通信過程)。北京銷售專用電話卡辦理
終端中用戶端的核心是對用戶的管理,也就是常用的CRM系統(tǒng)。而AI端,則是圍繞著AI機(jī)器人的設(shè)計(jì)、優(yōu)化去設(shè)計(jì)。
通信過程,由呼叫系統(tǒng)實(shí)現(xiàn),包括通話的撥打、接聽、掛機(jī)、轉(zhuǎn)接等,也包括通話線路的管理、配置。
1. 電話呼叫系統(tǒng)
呼叫系統(tǒng)是一種針對電話的軟交換解決方案,通過呼叫系統(tǒng),電話機(jī)器人才能與用戶通信設(shè)備進(jìn)行通話。
機(jī)器人、呼叫中心、終端間簡單的關(guān)系圖
呼叫系統(tǒng)由來已久,經(jīng)過這么多年的發(fā)展,其功能已經(jīng)十分完善和穩(wěn)定。
在AI驅(qū)動(dòng)的公司里,也會(huì)采用FreeSwitch之類的開源系統(tǒng)進(jìn)行自研。但是這個(gè)只有在有相應(yīng)技術(shù)棧(C++),對呼叫系統(tǒng)有開發(fā)經(jīng)驗(yàn)積累時(shí)可以去嘗試。
因?yàn)?,對于呼叫系統(tǒng)的租戶來說,呼叫系統(tǒng)最關(guān)鍵的就是高效和穩(wěn)定。要想進(jìn)行商業(yè)化,就必須保證呼叫系統(tǒng)的高并發(fā)和穩(wěn)定,這是一切的前提條件。
除去FreeSwitch之外,也可以購買第三方成熟的呼叫系統(tǒng),例如國外比較有名的Genesys等。
購買成熟的呼叫系統(tǒng),一個(gè)是系統(tǒng)本身已經(jīng)比較穩(wěn)定、功能齊全,該踩的坑前人已經(jīng)幫忙全部踩過。還有就是減少研發(fā)成本,尤其是對于AI型公司來說,無需為呼叫系統(tǒng)再浪費(fèi)研發(fā)資源和時(shí)間。
在呼叫系統(tǒng)中,會(huì)有一些專用名稱,不是這個(gè)圈子的一般很難理解,例如坐席、線路、并發(fā)等。
坐席:
主要是外呼電話,一般也叫SIP電話。每個(gè)客服人員的賬號(hào)會(huì)綁定一個(gè)坐席,擁有坐席之后,即可通過電腦在線進(jìn)行撥打、接聽電話。
線路:
可以理解為外呼時(shí)用到的主叫號(hào)碼,通常為一批號(hào)碼的集合,號(hào)碼的類型很多,手機(jī)卡、中繼線等等,有不同的接入方式。
線路資源會(huì)根據(jù)運(yùn)營商時(shí)常變動(dòng),所以通常由專門的線路商去維護(hù)和運(yùn)營。線路會(huì)被很多業(yè)務(wù)共用,只能外呼,不能呼入。為便于區(qū)分,這條線路下的所有號(hào)碼會(huì)有相同的歸屬地,撥打的是類似的業(yè)務(wù)。
例如:北京教育線,便表示外顯是北京,主要撥打教育營銷相關(guān)的業(yè)務(wù)。
當(dāng)然上述主要針對的是外呼場景,呼入場景只需要向運(yùn)營商購買穩(wěn)定的線路即可。
并發(fā):
指同時(shí)間可以進(jìn)行幾路通話。并發(fā)受限的因素較多:呼叫系統(tǒng)性能、機(jī)器人配置數(shù)量、線路資源。
呼叫系統(tǒng)性能:這是個(gè)技術(shù)問題,當(dāng)高并發(fā)時(shí),服務(wù)端無法處理,容易造成漏接、無響應(yīng)等各種問題,并影響接聽率。
線路資源限制:簡單理解為線路中實(shí)際可外呼的sim卡限制(實(shí)際上很多種類型),算是種物理限制,只能多找一些線路,沒有其他辦法。
2. AI機(jī)器人
嚴(yán)格地來說,AI機(jī)器人就是一整套回應(yīng)的話術(shù),內(nèi)容包括核心的對話流程和知識(shí)庫。根據(jù)業(yè)務(wù)的不同,采用不同的技術(shù)方案。
1)兩類業(yè)務(wù)場景
在業(yè)務(wù)上粗略地可分為兩種場景:呼出場景、呼入場景。
呼出場景:
主要是電話營銷、通知等業(yè)務(wù)。
大部分的呼出電話都是陌拜電話,例如教育培訓(xùn)、股票投資、醫(yī)療保險(xiǎn),都是廣撒網(wǎng)的方式大量外呼。這些電話本身就是對用戶時(shí)間的一種侵占,對用戶來說沒有意愿來配合進(jìn)行問答,隨時(shí)都可能被用戶提前掛機(jī)。
總的來說,呼出場景的特點(diǎn)是:話術(shù)簡單,單通價(jià)值低,用戶不配合。針對此類場景,機(jī)器人采用的堆關(guān)鍵詞的方式即可實(shí)現(xiàn)。
呼入場景:
主要是業(yè)務(wù)查詢、預(yù)訂等業(yè)務(wù)。
常見的呼入場景,例如有10086。之前撥打10086,使用的是IVR模式,需要按鍵操作,現(xiàn)在已經(jīng)可以語音直接查詢話費(fèi)信息。由于是用戶主動(dòng)呼入,帶有明確的目的,對電話機(jī)器人的容忍度相對較高。而機(jī)器人核心價(jià)值是幫助用戶完成任務(wù),在無法識(shí)別等情況下,可與用戶確認(rèn),方便明確意圖。
總結(jié)一下,呼入場景的特點(diǎn)是:業(yè)務(wù)穩(wěn)定,單通價(jià)值高,用戶配合。此類場景,就需要用到Rasa之類的聊天機(jī)器人框架,利用意圖識(shí)別、實(shí)體提取完成任務(wù)。PS:呼入場景,類似于智能音箱。
2)電話機(jī)器人和在線機(jī)器人對比
本質(zhì)上電話機(jī)器人與在線客服機(jī)器人相同。區(qū)別在于輸入端一個(gè)是語音,一個(gè)是文本。
語音信息包含著更多無用的信息,文本要比語音更加精準(zhǔn)和高效。當(dāng)然語音中包含的語氣、語速、情緒等也有部分價(jià)值,例如可以用來判斷男女。
電話機(jī)器人由于需要先ASR(語音識(shí)別),轉(zhuǎn)成文本之后,再NLP(語義理解),而在線機(jī)器人是直接進(jìn)行NLP處理。因此,在最終的理解效果上,電話機(jī)器人的準(zhǔn)確性會(huì)差一些。
3)語音輸入的難點(diǎn)與方案
語音輸入的難題,便是上文中所羅列的,這里不再贅述。這些難題不是目前技術(shù)可以解決的,或者說解決成本很高。這里就簡要列舉一些方案,具體需要在實(shí)際場景中多次嘗試,才能得出最優(yōu)方案。
方言問題:
最直接的方案是采用方言的ASR識(shí)別引擎。針對方言的ASR識(shí)別,在科大訊飛、阿里云等基礎(chǔ)服務(wù)商都有提供。
問題是:第一,方言種類多,而一般識(shí)別引擎只能識(shí)別部分使用范圍廣的方言,如四川話、粵語;第二,不知道該用哪套識(shí)別引擎,用戶范圍廣,在接通前都是未知的;第三,比較貴,商用成本高。
另一種是笨辦法,但是也有效。通過人工巡檢,將ASR識(shí)別結(jié)果中的擬聲詞、錯(cuò)別字、近似詞都作為關(guān)鍵詞積累起來,積累越多,越容易被識(shí)別。
噪音識(shí)別問題:
噪音可分為人聲噪音和環(huán)境噪音。
常見的人聲噪音例如:周圍有人在說話、電視劇的聲音等。由于設(shè)備的限制,沒辦法利用麥克風(fēng)陣列等硬件去判斷遠(yuǎn)近場,因此沒有什么特別好的解決方案,畢竟電話的音頻就只有8000Hz、單聲道、16位。
環(huán)境噪音,在呼叫系統(tǒng)中就可以用濾波器、譜減法等方式降噪,還可以聲音切片的長度。
例如:正常說話單個(gè)字的時(shí)長都大于200ms,過濾掉短促的噪音。此外,在送往ASR之前,還可以利用AI進(jìn)行一次噪音識(shí)別,過濾之后再送往ASR識(shí)別。而ASR識(shí)別引擎本身也具備過濾噪音的功能。具體的實(shí)施方案可根據(jù)實(shí)際效果、商業(yè)化角度去搭配組合。
語氣詞、口頭禪:
例如:嗯——這可能只是在組織語言時(shí)的停頓或者是傾聽時(shí)禮貌性的反應(yīng),但會(huì)被識(shí)別成肯定的意思。
此類情況比較常見,在人工巡檢過一批錄音后,發(fā)現(xiàn)作為語氣詞的情景次數(shù)要大于作為肯定的情景次數(shù)。
因此,第一步是將單字的“嗯”、“哦”等詞從意圖中剔除,保留“嗯好的…”等更明確表達(dá)該意圖的詞。
第二步則是在AI對話時(shí)候,盡量不要讓用戶開放式回答,而是引導(dǎo)用戶回答,比如用“是不是”、“可以嗎”等結(jié)尾,潛移默化地影響用戶回答“是”、“不是”、“可以”等指令明確的詞。
打斷、表達(dá)不清:
這個(gè)問題比較難表述,繼續(xù)舉個(gè)栗子:
假設(shè)AI詢問兒童年齡,用戶回答:“噢……我小孩4歲”,中間停頓了一下。在正常邏輯中,為讓AI快速響應(yīng),在用戶回答停頓的時(shí)候,已經(jīng)執(zhí)行下一流程。因此,這時(shí)AI可能會(huì)忽略用戶后半句有價(jià)值的對話。
該問題往往容易使AI漏掉關(guān)鍵信息,同時(shí)也影響通話體驗(yàn),給人生硬的感覺。針對該問題,目前是通過規(guī)則去控制,通過人工對通話記錄的總結(jié),制訂處理規(guī)則。如什么情況下允許打斷、什么條件下替換為上節(jié)點(diǎn)意圖,這些都需要在實(shí)際場景中不斷總結(jié)優(yōu)化。
4)話術(shù)設(shè)計(jì)
機(jī)器人的對話設(shè)計(jì)有很多配置方式。底層基本都是Taskflow的模式,是類似于流程圖,將多個(gè)節(jié)點(diǎn)連接起來。這種方式能夠逐漸讓問題的范圍收斂,處理復(fù)雜的業(yè)務(wù)對話。
節(jié)點(diǎn):
節(jié)點(diǎn)主要是針對輸入的內(nèi)容進(jìn)行意圖判斷,最后根據(jù)判斷分流給下一個(gè)節(jié)點(diǎn)。
在智能設(shè)備中經(jīng)常會(huì)提及一個(gè)詞叫“技能”,通過技能,可以完成特定的指令。節(jié)點(diǎn)也類似于技能,不過在通話場景下,范圍會(huì)比技能還要大一點(diǎn)。
針對語音進(jìn)行判斷,即“技能”,可通過關(guān)鍵詞、實(shí)體提取等方式判斷意圖。
針對按鍵進(jìn)行判斷,也就是IVR,這是電話獨(dú)有的功能,用戶可以準(zhǔn)確地輸入數(shù)字,不用擔(dān)心ASR識(shí)別錯(cuò)誤,在核對用戶身份證信息等場景下特別有用。
針對系統(tǒng)數(shù)據(jù)進(jìn)行判斷,此時(shí)不需要用戶輸入,是由系統(tǒng)根據(jù)已有信息直接給出判斷結(jié)果,如上一條中的身份證信息判斷。
流程組:
在常見的銷售、客服話術(shù)中,通??梢苑譃殚_場白、業(yè)務(wù)介紹、業(yè)務(wù)處理、結(jié)束語幾個(gè)階段。為了方便話術(shù)設(shè)計(jì)和后期優(yōu)化,也會(huì)根據(jù)此類分發(fā)去設(shè)計(jì)節(jié)點(diǎn)流程,并用流程組作為階段進(jìn)行分隔。
5)AI效果優(yōu)化
衡量一個(gè)AI機(jī)器人的好壞,要看它最終帶來的收益和成本。
在呼出場景中,需要讓AI最終意向率到達(dá)或者略小于人工水平,畢竟每一通電話、每一個(gè)號(hào)碼都是成本的。
在呼入場景中,則需要關(guān)注問題解決率、客戶滿意度等。必要時(shí)刻還是得使用人工坐席兜底,因此還需要關(guān)注人工介入情況。
優(yōu)化話術(shù)效果,主要通過錄音巡檢和分析每個(gè)節(jié)點(diǎn)的識(shí)別率、掛機(jī)率,為節(jié)點(diǎn)補(bǔ)充關(guān)鍵詞、說法集,也會(huì)嘗試不同的說話方式,具體的有時(shí)間再細(xì)講。
就目前而言,純AI接聽的完成率與人工接聽對比,還是有一定差距。因此真正適合純AI的應(yīng)用場景還是比較少,適合用在呼叫量大、內(nèi)容單一的場景,如:電話通知、催收M0。
在其他場景下,還是以AI+人工配合更為合適。AI負(fù)責(zé)前期簡單的對答,過濾和分流部分用戶,再由人工更靈活地解決問題。等到收集足夠多的說法集,歸納完善的話術(shù)之后,由 AI逐步接手,將人工后撤到下一節(jié)點(diǎn),層層后撤,減少人工投入。
3. CRM系統(tǒng)
每一通電話記錄都會(huì)經(jīng)過CRM分析用戶意向、最終通話結(jié)果。CRM系統(tǒng)基于業(yè)務(wù),主要負(fù)責(zé)對客戶的管理和跟進(jìn),整個(gè)CRM系統(tǒng)主要可分為3個(gè)方向:
對人員的管理:包括銷售、客服坐席的增刪改查和業(yè)務(wù)報(bào)表。
對客戶的管理:涉及到客戶信息、通話的意向度、完整跟進(jìn)記錄、狀態(tài)的流轉(zhuǎn)。
對資源的管理:這里的資源可以包括線路的管理運(yùn)營、話術(shù)設(shè)計(jì)和優(yōu)化。CRM系統(tǒng)較為常見,這里就不再多說,根據(jù)實(shí)際需求,進(jìn)行調(diào)整和功能擴(kuò)充即可。
二、主要競爭對手
圖為當(dāng)時(shí)做競品分析時(shí),歸納的競品公司
在智能外呼這個(gè)賽道,直接競爭的是兩類企業(yè):傳統(tǒng)的軟件提供商和以AI為核心的科技公司。
客服軟件提供商在客服系統(tǒng)、呼叫中心等產(chǎn)品上深耕多年,有相當(dāng)完善的產(chǎn)品矩陣和客戶資源,對客戶需求、實(shí)施解決方案都是經(jīng)驗(yàn)豐富。
AI型科技企業(yè),則是垂直切入外呼場景,依托自身的AI技術(shù),對單一場景進(jìn)行單點(diǎn)突破,鞏固自身的技術(shù)壁壘。只是就目前來看,AI技術(shù)的瓶頸還未突破,對智能對話、通話體驗(yàn)的改變不大。
除了上述兩類企業(yè)外,百度云、阿里云、騰訊云之類的云服務(wù)商,利用自身優(yōu)勢,將技術(shù)集成到開放平臺(tái)中,形成完整的行業(yè)解決方案。為企業(yè)提供ASR、NLP、TTS、呼叫系統(tǒng)甚至是線路等基礎(chǔ)技術(shù)服務(wù),降低了技術(shù)門檻,企業(yè)不需要特別的技術(shù)儲(chǔ)備,即可搭建出自己的系統(tǒng),可以說是一種降維打擊。
PS:事實(shí)上AI驅(qū)動(dòng)的企業(yè),完善自身技術(shù)后,也在逐步開放AI能力,提供技術(shù)服務(wù),為其他企業(yè)賦能。
而研究聊天機(jī)器人的企業(yè),在NLP技術(shù)的研究和積累頗多,也容易快速切入。
三、核心競爭力
雖然說是AI機(jī)器人,核心亮點(diǎn)是AI。但是,在實(shí)際應(yīng)用中真正利用到AI技術(shù)的并不多。
ASR:除非自身有足夠多的語料和研發(fā)能力(還要考慮研發(fā)成本、更新維護(hù)能力),否則ASR大多都是通過科大訊飛、阿里云等大平臺(tái)進(jìn)行識(shí)別。
NLP:這個(gè)是一個(gè)技術(shù)核心,不過就目前的提升效果,通過填充關(guān)鍵詞之類的笨辦法也能達(dá)到相同效果。
TTS:在實(shí)際語音播放中,除了變量等必須由TTS合成外,大部分話術(shù)都可通過提前人工錄音的方式完成,且播放效果比TTS還要好。
個(gè)人認(rèn)為AI機(jī)器人的核心,不在于AI,而是基于業(yè)務(wù)場景的話術(shù)。客戶不會(huì)關(guān)心技術(shù)如何先進(jìn),而是看最終的接聽效果。當(dāng)一個(gè)話術(shù)調(diào)整成接近人工坐席效果時(shí),那么在這個(gè)業(yè)務(wù)場景可以說是形成了壁壘,拓展相似業(yè)務(wù)會(huì)更有優(yōu)勢。