亚洲欧美自拍另类丝袜卡通,亚洲国产中文字幕在线视频

主頁 > 知識庫 > 普強信息：智能語音在呼叫中心應(yīng)用中的場景化及關(guān)鍵問題

普強信息：智能語音在呼叫中心應(yīng)用中的場景化及關(guān)鍵問題

　　近年來，隨著人工智能以及智能語音應(yīng)用的飛速發(fā)展，各大公司及企業(yè)都在積極布局相關(guān)的技術(shù)應(yīng)用及場景，AI+行業(yè)的商業(yè)化推廣落地也進入了深水區(qū)。

　　從事語音、人工智能行業(yè)近10年，有幸見證并參與了行業(yè)的發(fā)展，也對智能語音在實際場景中的應(yīng)用及商業(yè)落地的難點有所體悟。下面是對智能語音技術(shù)的簡單介紹，并對其在實際應(yīng)用中應(yīng)關(guān)注的核心問題提出一些我的思考。

　　什么是智能語音技術(shù)，其發(fā)展如何？

　　我們平時接觸的任何語音相關(guān)應(yīng)用（如微信語音、語音輸入法、外呼機器人等），其實本質(zhì)都是兩大核心能力的體現(xiàn)——音轉(zhuǎn)字ASR和字轉(zhuǎn)音TTS。結(jié)合自然語言處理，理解并處理文本，即組成了人機交互的基本能力。

語音交互的基本模型

　　智能語音應(yīng)用基于三大要素：計算機算力、海量數(shù)據(jù)以及算法模型。隨著過去多年的積累，不同類型的語音語料積累的足夠多了，通過訓(xùn)練后的語音識別技術(shù)得以快速提升。相對10年前的情況來看，目前絕大部分語音識別技術(shù)的翻譯準(zhǔn)確率都已經(jīng)很不錯了，在噪音處理、語氣語調(diào)、語義理解等方面均已大大提升，而最終在商業(yè)化上的能力差異體現(xiàn)關(guān)鍵在于兩點：

　　一，是否擁有核心的自主底層專利技術(shù)與能力？

　　基于外接技術(shù)或引擎之上的智能語音商業(yè)化落地，終究是無根之水，難以持續(xù)的演化及進步。坦率的說，在這條賽道上競爭的廠商能擁有100%自主知識產(chǎn)權(quán)核心技術(shù)的并不多，在可預(yù)見的未來，這必將形成商業(yè)伙伴選擇供應(yīng)廠商的重要門檻。

　　二，是否有足夠多的商業(yè)落地場景和實施經(jīng)驗？

　　智能語音在行業(yè)及商業(yè)上的落地需要腳踏實地做實際的事情，解決真實業(yè)務(wù)上的痛點。大部分客戶需要的不僅僅是技術(shù)，而是一整套解決方案，優(yōu)化改造業(yè)務(wù)流程、項目指導(dǎo)以及經(jīng)驗總結(jié)，交流分享?；诟叨戎貜?fù)構(gòu)件的組合+部分的差異化定制才是項目成敗的關(guān)鍵。造輪子和組裝輪子在客戶的業(yè)務(wù)層面往往意味著極大的難度鴻溝與時間成本，而很多的友商伙伴們尚未真正意識這一點的重要性。

　　智能語音場景化需要關(guān)注的問題

　　就現(xiàn)在的實際情況來說，語音識別技術(shù)和應(yīng)用產(chǎn)品如果希望有更好的表現(xiàn)，還是要像過去幾年那樣持續(xù)不斷的去做數(shù)據(jù)訓(xùn)練：不同地域口音方言的訓(xùn)練、不同行業(yè)專業(yè)詞匯的訓(xùn)練。

　　既然數(shù)據(jù)和訓(xùn)練的投入是持續(xù)的，而且硬件及訓(xùn)練的成本也困擾著場景的落地，那么一味為了追求更高的轉(zhuǎn)譯準(zhǔn)確率在成本及效率上是否值得，也是需要深入去思考的。在商業(yè)化落地的角度來說，供應(yīng)商的準(zhǔn)確率從85%-90%，與90%-95%的訓(xùn)練代價在成本和時間上的投入，與及客戶期待是無法對等的，后者在訓(xùn)練周期與時間成本上很可能是前者的5-10倍，但收效甚微，而過度的追求準(zhǔn)確率亦會嚴(yán)重拖慢項目上線的時間進度與人力投入。那么我們在實際應(yīng)用中應(yīng)該如何選擇呢？

　　我們的建議是從業(yè)務(wù)上不應(yīng)過度的追求全文語音轉(zhuǎn)譯的準(zhǔn)確率，而應(yīng)該聚集于該場景下你所關(guān)注的具體訴求是什么，以場景應(yīng)用為導(dǎo)向，關(guān)注實施的執(zhí)行而不是過程。不是關(guān)注全文識別率準(zhǔn)不準(zhǔn)，而是我要識別的那部分準(zhǔn)不準(zhǔn)，因為絕大部分的真實業(yè)務(wù)場景下的語音應(yīng)用均是限定在某個特定范圍內(nèi)。

　　以語音質(zhì)檢為例，如果以模型質(zhì)檢點相關(guān)的文本來訓(xùn)練往往都能實現(xiàn)90%+，甚至更高的水平，而全文轉(zhuǎn)譯卻很難達到，但這并不影響語音質(zhì)檢的實際應(yīng)用，因為在該場景下，只要與質(zhì)檢點及模型相關(guān)的那部分語音識別準(zhǔn)確率能達到即可為質(zhì)檢工作提供高效及有力的支撐。

　　大部分質(zhì)檢的實際工作的真實關(guān)注點是所謂的質(zhì)檢項是否滿足即可，全文的語音轉(zhuǎn)譯是否準(zhǔn)確在該場景下是一種類似白噪音的存在，準(zhǔn)確與否在大多數(shù)的情況下并不會影響該場景的真實應(yīng)用，這就是一種應(yīng)用為先的思考考量。

　　因此，請不妨嘗試著以這個思路來分析一下你手中的業(yè)務(wù)場景：你想要識別的內(nèi)容應(yīng)該不會很多很多，而自然語言中其實還含有與你希望利用的業(yè)務(wù)價值大量無關(guān)的，諸如無意義語氣詞，重復(fù)語句等。所以，語音識別并不一定需要非常高的準(zhǔn)確率，它并不會實際阻礙你去利用該技術(shù)實現(xiàn)語音文本分析及探索業(yè)務(wù)價值。

　　圖像識別技術(shù)（OCR）技術(shù)就是一個很好的案例來說明這個問題，從普遍的識別準(zhǔn)確性來看（類似于語音的全文轉(zhuǎn)譯準(zhǔn)確率），OCR并不如大家想像中的智能，準(zhǔn)確率亦沒有想像中的高，通用性場景下基本都低于85%。以停車場車牌識別為例，該場景車牌識別上卻非常普遍好用，準(zhǔn)確度也高，就是利用了這種場景化下的針對訓(xùn)練（車牌識別所需的范圍是相對可控的，要識別的對象也很有限——近場識別，字母、數(shù)字，車牌形狀統(tǒng)一），同時拋棄了其他無用識別的干擾。

　　這就是筆者上面所說的應(yīng)用為先的思考思路，類似的例子還有很多，請大家不妨試試跳出思維的定式框框來重新思考您在實際應(yīng)用中的智能語音應(yīng)用場景。

標(biāo)簽：普洱延安漯河宿州云南南昌寧夏儋州

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《普強信息：智能語音在呼叫中心應(yīng)用中的場景化及關(guān)鍵問題》，本文關(guān)鍵詞；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。