在移動互聯(lián)網(wǎng)時代,以App Store為代表的移動應(yīng)用商店成為了流量入口,人們通過操縱App和信息進(jìn)行移動交互。
而隨著技術(shù)的進(jìn)步和移動社交媒體的快速發(fā)展,AI+時代,AI+行業(yè)應(yīng)用成為了流量入口,語音交互便成了極具競爭力的交互方式。
為共同促進(jìn)AI語音交互的數(shù)字化智能化發(fā)展,9月19日上午,百度AI技術(shù)生態(tài)部高級平臺運(yùn)營顧問張揚(yáng)攜百度AI核心技術(shù)團(tuán)隊近10位技術(shù)專家赴大壩科技總部,與大壩科技核心技術(shù)團(tuán)隊就“AI語音交互發(fā)展前景、現(xiàn)實難點(diǎn)和未來”、“AI語音領(lǐng)域發(fā)展成果”等話題,展開了深入的技術(shù)探究與分享。
【會議現(xiàn)場】
好的語音交互如何衡量?
語音交互是最自然的人機(jī)交互方式,它極大地降低了人們與機(jī)器交互時的學(xué)習(xí)成本,將人機(jī)交互綜合效率帶上新的臺階。
那么,好的語音交互在于提高人的使用表現(xiàn),可以從速度、準(zhǔn)確性、注意力三個維度衡量。而讓用戶使用速度越快、識別越準(zhǔn)確,并且占用最少注意力的,自然稱得上是好的交互。
為針對市場痛點(diǎn)制定有效的AI+語音應(yīng)用解決方案,交流會上,百度AI核心技術(shù)團(tuán)隊與我們(大壩科技)就“語音交互發(fā)展的現(xiàn)實難點(diǎn)”問題,進(jìn)行了簡單梳理。
“相比即時的圖像和文字反饋,傳統(tǒng)語音交互是一種不太合格的輸出方式,它過于緩慢、效率低下”,百度AI技術(shù)生態(tài)部高級平臺運(yùn)營顧問張揚(yáng)表示,“聽覺是線性的,我們只能聽完一句話再聽下一句,而不能像視覺一樣瞬間完成圖片理解,也不能如文本般選擇性閱覽,當(dāng)前的電話語音服務(wù)系統(tǒng)就存在這種浪費(fèi)時間的方式。”
【大壩科技CEO張溫瑞 左三】
對此,大壩科技CEO張溫瑞也表示,持續(xù)聽語音會消耗大量注意力和記憶資源,就傳統(tǒng)的電話語音服務(wù)系統(tǒng)來說,如果客服念完卻沒有聽到想要的內(nèi)容,重聽按0相當(dāng)耗時。另一方面,我們大部分的信息來自于視覺,但即便是當(dāng)前的AI智能語音系統(tǒng),也很難輸出準(zhǔn)確率95%的視覺信息。
語音交互市場情況如何?
目前,在語音交互的相關(guān)領(lǐng)域已經(jīng)出現(xiàn)了大批玩家和用戶,但由于語音語義的復(fù)雜性,經(jīng)常出現(xiàn)答非所問的情況,使用戶形成語音交互可有可無的印象,導(dǎo)致用戶習(xí)慣難以養(yǎng)成。
沒有人愿意對著冷冰冰的機(jī)器說話,然后得到毫無感情甚至是錯誤的回答。
所以,語音交互要達(dá)到高效、智能、好用,勢必要借助AI+通信與大數(shù)據(jù)的創(chuàng)新融合能力,讓語音交互應(yīng)用從等待態(tài)轉(zhuǎn)換為就緒態(tài),能即時響應(yīng)用戶的各項語音指令。
AI語音應(yīng)用不是某種獨(dú)立產(chǎn)品
“AI語音應(yīng)用不應(yīng)該是某種獨(dú)立產(chǎn)品,應(yīng)該是所有企業(yè)或者個人通信信息化都需要調(diào)用到的一種能力。”CEO張溫瑞表示,“市場最終需要的還是行業(yè)應(yīng)用軟件和系統(tǒng),那么AI也終會回歸成為一種服務(wù)于通信行業(yè)的基礎(chǔ)能力。”
換言之,語音交互的發(fā)展是離不開AI+通信與大數(shù)據(jù)的創(chuàng)新融合能力。
【會議現(xiàn)場】
會議歷時兩個多小時,在場技術(shù)專家均從不同維度和視角,分析了當(dāng)前和未來語音交互應(yīng)用的場景及客戶群。最終,會議以百度AI與杭州大壩科技有限公司達(dá)成在AI智能語音領(lǐng)域的持續(xù)深度合作共識而結(jié)束。
最后,大壩科技希望通過悟空話務(wù)機(jī)器人的語音交互能力和團(tuán)隊自身的研發(fā)優(yōu)勢,與百度AI攜手打造數(shù)字化智能化語音交互新生態(tài),為廣大客戶提供一站式智能化貼身服務(wù),更為AI+生態(tài)的創(chuàng)新發(fā)展獻(xiàn)力!