主頁 > 知識庫 > 搜狗地圖標注語音是汽車場景中最合理的交互方式

搜狗地圖標注語音是汽車場景中最合理的交互方式

熱門標簽:資陽電銷 太原電銷 六安電銷 搭建電銷機器人 呼叫中心系統(tǒng) 濟寧電銷 臨汾電銷 柳州電銷
12月17日,搜狗地圖標注總經(jīng)理在世界年度盛典上共享了搜狗智能副駕這款語音交互產(chǎn)品開發(fā)歷程與用戶體會,
在看來,現(xiàn)在我們所觸摸的所有交互方法中,只要語音才是在車內(nèi)場景中最合理的交互方法,由于當你在開車的時分,你的手、眼都歸于被占用的一個狀況,想要安全駕馭就不能因而分神。
現(xiàn)在的轎車廠商與導航供貨商在車內(nèi)都有類似的處理方案,可是經(jīng)過實踐體會它們的產(chǎn)品并不能完全處理用戶痛點,搜狗智能副駕的研制初衷正是圍繞這些尚未被處理的痛點進行的。 傳統(tǒng)形式的語音基本上是這樣一個漏斗的模型。榜首級:語音辨認率。第二級:受限于語意了解的正確率。第三級:受限于查找的正確率。
搜狗智能副駕所著重的語音交互,并不是簡略地用語音辨認把用戶說的話簡略翻譯過來就完畢了,而是要經(jīng)過后續(xù)一系列的語意、地圖層面做一些剖析作業(yè),終究給用戶一個正確的反應成果。
以下是在 世界年度盛典上的講演全文,略經(jīng)編輯:
今日我想要介紹的搜狗智能副駕,這兒面有適當一部分技能其實跟同傳也是相關(guān)的,也就是搜狗語音技能,搜狗在曩昔一年以來在AI領(lǐng)域里邊所做的測驗,即把語音辨認技能、語意了解技能和地圖導航技能結(jié)合起來,在轎車場景中向用戶供給內(nèi)容處理方案。
在介紹搜狗智能副駕之前,先給我們看一下,我們所調(diào)查到的用戶在車內(nèi)的一個需求的狀況。現(xiàn)在我們發(fā)現(xiàn),用戶在車內(nèi)信息交互的需求,其實首要就是兩類,一類是駕馭相關(guān)的,比方說導航、路況、沿途信息等,大約要占到92%。還有一類是互聯(lián)網(wǎng)相關(guān)的,比方說聽音樂、播送、新聞、聊微信等這些東西,用戶在車內(nèi)的信息交互需求,占比最高的首要就是這兩類。
現(xiàn)在,用戶的這種需求是怎樣被滿意的呢?在轎車場景里邊,但凡用戶想聽歌、打電話的時分,轎車制造商都現(xiàn)已為用戶供給了一些處理方案,可是曾經(jīng)首要都是根據(jù)物理的這種按鍵或旋紐,很不便利,所以我們也注意到在最近的一兩年里邊,轎車制造商現(xiàn)已開端把這種語音辨認的技能引進到車內(nèi)來。
語音交互毫無疑問是在車里邊一個最合理的一種交互方法,由于究竟你在開車的時分,你的手跟、眼都是歸于被占用的一個狀況。
轎車廠商做出來的語音交互首要問題就是聽不懂,你跟體系絮絮不休說了半天,體系只按它自己的邏輯去解說,你如果不按它的方法來輸入指令的話,它就回絕合作你。
現(xiàn)在除了轎車廠商在供給這種語音交互的這種處理方案之外,互聯(lián)網(wǎng)廠商不是也在做這些作業(yè)嗎?有許多的互聯(lián)網(wǎng)廠商現(xiàn)在現(xiàn)已開端在自己的車內(nèi)的場景里,比方導航功能中開端植入這種語音交互的才干,互聯(lián)網(wǎng)廠商現(xiàn)在做得怎樣樣?
導航供貨商所供給的語音交互的表現(xiàn)首要所反應出來的問題其實就是說不清,我們知道語音交互它是個雙向的概念,不光是你說的東西機器能聽懂,一起機器也應該說人能聽懂的東西,不能當人說完了之后,機器只管把成果給你列出來,然后讓你再去從頭挑選和交互,如果是這樣一種交互方法的話,在車內(nèi)毫無疑問是十分不安全的。
所以,我們總結(jié)下來就是,就現(xiàn)在來看,用戶體會到的語音交互,要么就是聽不懂,要不就是說不清,用戶真實需求的語音交互是什么呢?它是需求一個天然的言語對話,可以聽懂用戶想要什么,可以像人一樣地去講出這個答案。下面我們看一下,我們以為真實的語音交互應該是什么樣的。
這就是我們想為我們推出的搜狗智能副駕的一個初衷,我們希望真實能在車內(nèi),用戶是以這樣一種交互方法去跟體系打交道的,而我們這個產(chǎn)品實踐現(xiàn)已在7月初的時分發(fā)布了,現(xiàn)在安卓和iPhone手機都可以下載搜狗地圖標注,搜狗地圖標注里邊會有一個形式叫做智能副駕,進到這個形式之后就可以跟汪仔進行語音交互,你可以說出你的需求是什么,它對話的方法大約就是這樣的。
你先喚醒它,比方你好汪仔,他就會問你要去哪兒,你說去奧森,它知道奧森是有南門跟北門的,于是乎它會說奧森有兩個你去哪一個,是南門仍是北門。如果你說南門,終究它就會找到奧森的南門并且主動為你啟動導航。
我們不要小看這個簡略的進程,實踐上這個進程背后是有十分復雜的技能的支撐,才干保證有這樣一個杰出的體會的。在轎車上的一個智能幫手,如果想做到一個杰出的語音交互體會的話,我們以為有4點需求做到:
榜首個,聽得對。這是最基本的,當用戶說出一段話后可以正確地轉(zhuǎn)譯成文字。
第二個,聽得懂。就是你光聽對了不可,你得知道他想表達什么,什么意思。
第三個,可以說。幫用戶查找到成果反應后,需求正確地把它表達出來。
第四個,要有相關(guān)十分豐富的常識,不然無法處理想要的問題。
我們來看一個實踐的比如,比方說用戶對體系說要去某個當?shù)?,體系會辨認到許多的可能性,進入到語意剖析環(huán)節(jié),當我們把地圖引進進來的時分,決策后會發(fā)現(xiàn)某個當?shù)氐母怕矢?,所以終究剖析下來用戶應該想去這個當?shù)亍?br /> 我說這個比如是想跟我們說,在聽得對這個環(huán)節(jié),不是簡略地用語音辨認把用戶說的話簡略翻譯過來就完畢了,而是說你要經(jīng)過后續(xù)的一系列的像語意、地圖層面做的一些剖析的作業(yè),然后你才干知道用戶說的哪一個是對的。經(jīng)過這個比如就能發(fā)現(xiàn),我們經(jīng)過語意和地圖的糾錯,使終究體系選出了正確的目的地。
像我們剛才在視頻里看到的一些比如,比方你想在路上趁便加油、吃麥當勞等行為,現(xiàn)在在搜狗一個巨大的語意網(wǎng)絡里邊,現(xiàn)已可以聽懂10萬個類似像這樣的語意途徑,也就說你表達一種需求,你可能有不同的說法,在語意剖析引擎這邊,它可以兼容許多種說法,現(xiàn)在我們整個的對話途徑現(xiàn)已超過了10萬個。
接下來我們來看看,比方說在傳統(tǒng)語音交互里邊,你說你要去首都機場的時分,它會說我給你找到5個目的地,我們的做法是直接精簡成你要去哪個航站樓或者航班號(這樣只要15個字),這種方法就是用戶所能承受的十分天然的語音交互。
所有的這些可以聽得懂,是建立在一個十分重要的基礎(chǔ)上,我們對地圖數(shù)據(jù)做了十分重要的重構(gòu),我們把這個稱之為主子聯(lián)系,我們大約可以挖掘出500多萬的主子聯(lián)系。
除了主子聯(lián)系還有所謂的容器聯(lián)系(比方說搜狗公司在搜狗網(wǎng)絡大廈里邊),還有許多的商圈地片,當你說你要去大鐘寺的時分,不是簡略給你導到大鐘寺地鐵站,而是問你要去大鐘寺的什么當?shù)?,這些都是我們界說的叫做地圖常識。
除了地圖常識之外還有許多跨域的常識,像航班、洗車、車站等都是我們所謂的有常識的領(lǐng)域。傳統(tǒng)形式的語音基本上是這樣一個漏斗的模型:
榜首級:語音辨認率。
第二級:受限于語意了解的正確率。
第三級:受限于查找的正確率。
終究一個漏斗剩下來,會話的成功率只要68.4%,我們可能會疑問怎樣榜首個環(huán)節(jié)語音辨認正確率只要80%,這是由于現(xiàn)在有許多的語音的辨認盡管都說自己的所謂字正確率可以到達90%幾,可是你一旦把它變成一個語句的話,立刻迅速地辨認率就會下降下來。
而搜狗這邊的做法是,每一級我們都會有一個糾錯,都會根據(jù)后面的成果對前面進行反向糾錯的進程。我們最終做下來的話,會話成功率可以做到90%,這個都是搜狗的自有技能。
搜狗這次所供給的智能副駕,中心要害點是在于所有的東西全部都是自己的中心技能,可以保證有最佳的用戶體會,歸于一個技能與體會的閉環(huán)。

標簽:廈門 怒江 綏化 畢節(jié) 柳州 德陽 楊凌 新鄉(xiāng)

巨人網(wǎng)絡通訊聲明:本文標題《搜狗地圖標注語音是汽車場景中最合理的交互方式》,本文關(guān)鍵詞  搜狗,地圖,標注,語音,是,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《搜狗地圖標注語音是汽車場景中最合理的交互方式》相關(guān)的同類信息!
  • 本頁收集關(guān)于搜狗地圖標注語音是汽車場景中最合理的交互方式的相關(guān)信息資訊供網(wǎng)民參考!
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266