主頁 > 知識(shí)庫 > 語音識(shí)別技術(shù)將改變的5個(gè)行業(yè)

語音識(shí)別技術(shù)將改變的5個(gè)行業(yè)

熱門標(biāo)簽:互聯(lián)網(wǎng)運(yùn)營 Linux服務(wù)器 人工智能 馳名商標(biāo)保護(hù) 百度競價(jià)排名 萬科 電銷機(jī)器人多少錢一臺(tái) 網(wǎng)站文章發(fā)布

 
  
  一、語音識(shí)別技術(shù)是什么
  
  語音識(shí)別技術(shù),也被稱為自動(dòng)語音識(shí)別AutomaTIc Speech RecogniTIon,(ASR),其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。與說話人識(shí)別及說話人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。
  
  二、語音識(shí)別技術(shù)原理和應(yīng)用
  
  其工作原理:
  
  動(dòng)態(tài)時(shí)間伸縮方法使用瞬間的、變動(dòng)倒頻。1963年Bogert et al出版了《回聲的時(shí)序倒頻分析》。通過交換字母順序,他們用一個(gè)含義廣泛的詞匯定義了一個(gè)新的信號(hào)處理技術(shù),倒頻譜的計(jì)算通常使用快速傅立葉變換。
  
  應(yīng)用場景:
  
  在過去的一年里,語音交互已經(jīng)成為了人們關(guān)注的焦點(diǎn),但為什么這個(gè)10年前的技術(shù)現(xiàn)在才成為一個(gè)大熱門呢?盡管自上世紀(jì)90年代以來,計(jì)算機(jī)已經(jīng)能夠接受語音指令,但這些接口從來沒有發(fā)揮出它們的潛力。
  
  得益于云數(shù)據(jù)和人工智能' target='_blank'>人工智能的發(fā)展,我們終于有能力實(shí)現(xiàn)真正的對話界面。亞馬遜的Alexa、谷歌的Assistant,、蘋果的Siri和微軟的Cortana等語音服務(wù)越來越受歡迎,使得對話界面成為當(dāng)今科技巨頭的首要任務(wù)。
  
  這些應(yīng)用程序試圖用最簡單的工具——人類的聲音,創(chuàng)建一種復(fù)雜的、無鍵盤的交互。頂尖科技公司重新專注于提高語音處理技術(shù),這將成為在其他行業(yè)普及語音界面的主要?jiǎng)恿Α?br />   
  在iPhone問世之前,觸屏界面就已經(jīng)存在了,但在蘋果采取行動(dòng)之前,技術(shù)和互動(dòng)還沒有達(dá)到廣泛普及的程度?,F(xiàn)在,聲音也達(dá)到了類似的臨界點(diǎn)。
  
  在2017年的大會(huì)上,谷歌聲稱在一年內(nèi)使用深度學(xué)習(xí)算法將其單詞錯(cuò)誤率從8.9%降至4.5%。語音處理技術(shù)的這種改進(jìn),為語音用戶界面帶來了巨大的希望。
  
  例如:像下面這樣的對話交流無疑將成為我們未來的一部分。
  
  Alexa,我下一輛火車什么時(shí)候去上班?
  
  有20分鐘的延遲。
  
  下一列火車將于9:42從柏林中央車站出發(fā),9:54到達(dá)韋斯克魯茨。
  
  Alexa,請給珍妮特和蒂姆發(fā)郵件說:對不起,我的火車晚點(diǎn)了。,我們開會(huì)要遲到10分鐘,我們可以在上午10:10開始嗎?
  
  如今亞馬遜、谷歌、蘋果和微軟這樣的科技巨頭都在大力投資,希望成為語音技術(shù)的領(lǐng)導(dǎo)者。
  
  三、語音識(shí)別將改變的5個(gè)行業(yè)
  
  1、汽車
  
  目前,司機(jī)在開車時(shí)可以做的事情非常有限。由于安全法規(guī),汽車行業(yè)只能提供有限的觸覺互動(dòng)。免提語音界面將給汽車制造商提供大量的新選項(xiàng)。這項(xiàng)技術(shù)還可以讓司機(jī)們的眼睛盯著路面,從而提高安全性。
  
  許多司機(jī)在開車的時(shí)候都在使用手機(jī)上的語音交流。如果汽車行業(yè)迅速行動(dòng),它可能會(huì)成為一個(gè)主要的用戶界面,在上下班的路上,每天都有幾個(gè)小時(shí)的時(shí)間被困在這里。
  
  在未來,駕駛將會(huì)是一種完全不同的體驗(yàn),你的汽車可能很快就會(huì)成為你生活的界面層。數(shù)字助理正在爭奪對語音指令感興趣的消費(fèi)者注意力,而汽車行業(yè)也有可能參與其中。我們在未來汽車上的行為很可能與我們在辦公室或客廳的行為相似。
  
  這意味著語音交互將是關(guān)鍵。
  
  2、高科技可穿戴設(shè)備
  
  由于語音技術(shù),無屏幕可穿戴設(shè)備將繼續(xù)獲得成功。到目前為止,F(xiàn)itbit等設(shè)備已經(jīng)成為需要額外移動(dòng)界面的傳感器。有了語音功能,這些可穿戴設(shè)備就可以開始獨(dú)立于操作系統(tǒng)運(yùn)行。
  
  即使是像谷歌眼鏡這樣的小屏幕設(shè)備也能從語音指令中受益。谷歌眼鏡失敗的部分原因是,佩戴這種技術(shù)讓人感覺很明顯不舒服。如果不需要物理按鍵或顯示器,像谷歌眼鏡這樣的設(shè)備就會(huì)變得更小、更輕、更少分散注意力。
  
  語音控制將增加可穿戴技術(shù)的應(yīng)用,并讓這些設(shè)備融入到消費(fèi)者的日常生活中。
  
  3、客戶服務(wù)
  
  語音技術(shù)已經(jīng)極大地影響了客戶服務(wù),而會(huì)話界面將在未來幾年帶來更大的變化。一個(gè)例子就是呼叫中心一直在使用語音識(shí)別技術(shù)來提高他們的會(huì)話能力。任何依賴于溝通的角色都將通過語音界面得到改善。
  
  人與人之間的聯(lián)系永遠(yuǎn)是理想的,但在許多情況下,語音界面可以增強(qiáng)連接。前臺(tái)的店員可能會(huì)發(fā)現(xiàn)自己有更多的時(shí)間來做重要的工作,而像亞馬遜的Alexa這樣的設(shè)備可以消除一些簡單的任務(wù)。零售商可能會(huì)發(fā)現(xiàn),在他們的店里有一個(gè)語音界面,可以讓他們在更少的員工的情況下完成同樣的工作。
  
  看看哪些公司會(huì)采用這種技術(shù),以及這將對他們的客戶體驗(yàn)產(chǎn)生什么樣的影響,這將是一件很有趣的事情。有一件事是肯定的:當(dāng)公眾更愿意與數(shù)字助理交談時(shí),對語音用戶界面(VUIs)的投資可以節(jié)省開支。
  
  4、視覺障礙的設(shè)備
  
  VUIs還將允許視覺障礙患者以之前被拒絕的方式與世界互動(dòng)。網(wǎng)絡(luò)和移動(dòng)端上的可訪問性總是讓人感覺像是事后才發(fā)現(xiàn)的,大多數(shù)公司都沒有完全解決這個(gè)問題。
  
  科技公司終于開始采取行動(dòng),幫助這個(gè)經(jīng)常被忽視的群體。這是第一次,沒有視力的人可以像使用觸摸屏的人一樣輕松地使用和訪問。這是語音控制中最令人興奮的一個(gè)方面,因?yàn)樗懈淖兩畹牧α俊?br />   
  5、語言翻譯和實(shí)時(shí)翻譯
  
  隨著語音識(shí)別的興起,語言翻譯也可能經(jīng)歷一段繁榮。像谷歌這樣的公司正投資于更智能的語音處理系統(tǒng),這些系統(tǒng)將會(huì)改變這個(gè)行業(yè)的未來。例如,谷歌翻譯已經(jīng)從一個(gè)簡單的文本翻譯應(yīng)用演變成具有聽力能力的成熟翻譯。
  
  這類技術(shù)進(jìn)步的原因是語音處理和機(jī)器學(xué)習(xí)研究,公司將利用語音處理技術(shù)的發(fā)展,在語言處理過程中發(fā)揮更大的作用。想象一下,通過一款簡單的可穿戴設(shè)備,能夠理解地球上的每一種語言。
  
  得益于語音技術(shù)的進(jìn)步,這一技術(shù)可能會(huì)成為現(xiàn)實(shí)。
杭州大壩科技有限公司大壩語音通知、短信通知、號(hào)碼隱

標(biāo)簽:贛州 大興安嶺 黃南 承德 綿陽 天門 麗江 呂梁

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《語音識(shí)別技術(shù)將改變的5個(gè)行業(yè)》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《語音識(shí)別技術(shù)將改變的5個(gè)行業(yè)》相關(guān)的同類信息!
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266