主頁 > 知識庫 > 語音控制開發(fā)之旅,能不能“說走就走”?

語音控制開發(fā)之旅,能不能“說走就走”?

熱門標(biāo)簽:網(wǎng)站排名優(yōu)化 百度競價(jià)排名 呼叫中心市場需求 Linux服務(wù)器 地方門戶網(wǎng)站 AI電銷 服務(wù)外包 鐵路電話系統(tǒng)
  三年前的2016年,互聯(lián)網(wǎng)女皇瑪麗•米克爾在其年度《互聯(lián)網(wǎng)趨勢》報(bào)告中曾經(jīng)預(yù)測,人機(jī)交互即將迎來新一輪的變革,而語音將成為人機(jī)交互的新范式。從那以后,本來已經(jīng)蠢蠢欲動的智能語音市場就真的應(yīng)聲“火”了起來。
  這把“火”究竟有多旺,我們可以從三個(gè)方面直觀地感受出來:其一,就是眾多互聯(lián)網(wǎng)巨頭在語音處理領(lǐng)域的積極投入;其二,是2017年之后以亞馬遜Echo為代表的智能音箱單品的火爆;其三,是類似Siri的語音助手功能在智能手機(jī)中滲透率越來越高。種種跡象都在告訴我們,智能語音相關(guān)的生態(tài)鏈正在逐漸成熟,基于智能語音的相關(guān)應(yīng)用遲早有一天會成為眾多智能產(chǎn)品的標(biāo)配,比如說在智能家居等應(yīng)用中的語音控制功能。
  當(dāng)然,想做率先“吃螃蟹”的人,也就必然會面臨著一系列需要跨越的“坑”。具體到智能語音控制領(lǐng)域,這樣的“坑”主要來自三個(gè)方面:
  首先是成本。因?yàn)槌杀臼侨魏我环N技術(shù)大規(guī)模普及的重要前提,特別是當(dāng)我們考慮到要將語音控制功能集成到不同的嵌入式設(shè)備中去,真正做到讓語音“無處不在”的時(shí)候,成本的壓力會更為突出。
  其次是缺乏整體解決方案。畢竟,對于新技術(shù)來說,完整成熟的參考設(shè)計(jì)方案會比較“罕見”。如果有,對于開發(fā)者來說將是真福利。
  再有就是如何順利接入語音處理引擎。眾所周知,智能語音控制應(yīng)用背后都會與一個(gè)云端的語音處理引擎相連,如亞馬遜的Alexa、科大訊飛開發(fā)語音平臺等,這其中有不少繁復(fù)的測試認(rèn)證過程。
  上面這三個(gè)制約因素也決定了語音控制方案開發(fā)之旅并不是一場“說走就走”的旅行,在此之前開發(fā)者免不了要做大量準(zhǔn)備工作。
  不過現(xiàn)在,情況不一樣了,因?yàn)橄旅孢@個(gè)由恩智浦開發(fā)的方案(見圖1),打破了以往的制約。在這個(gè)面積為30mmx40mm超小型電路板中,幾乎覆蓋了嵌入式語音識別所有的性能和功能需求,讓困惑開發(fā)者的難題迎刃而解。
圖1.基于恩智浦i.MX RT跨界處理器的語音控制方案(圖片來源:NXP)
  基于MCU的設(shè)計(jì)
  這個(gè)方案最鮮明的一個(gè)特點(diǎn)就是,其主控芯片采用的不是微處理器,而是一顆‘MCU’——恩智浦的i.MX RT跨界處理器。之所以稱為“跨界”,是因?yàn)橐环矫鎖.MX RT采用了主頻高達(dá)600MHz的Arm Cortex-M7內(nèi)核,性能甚至比普通的Cortex-A5都高一倍;而另一方面,其在成本和功耗方面又能夠與MCU看齊,而且繼承了MCU的開發(fā)工具鏈,使得以前熟悉MCU的開發(fā)者都能夠很快上手。正是因?yàn)檫@種“魚和熊掌”兼得的特性,i.MX RT一經(jīng)推出就受到了開發(fā)者的青睞。
  此番將i.MX RT引入到語音控制領(lǐng)域,根據(jù)恩智浦的估算,與以往基于微處理器的解決方案相比可以將總系統(tǒng)成本減少一半以上。這也使得這個(gè)基于MCU的語音控制方案極具競爭力。
圖2.i.MX RT106A跨界處理器系統(tǒng)框圖(圖片來源:NXP)
  整體解決方案
  該方案中使用的跨界處理器的型號是i.MX RT106A,它是通用的i.MX RT1060產(chǎn)品中的一個(gè)特殊型號,專門針對基于云端的嵌入式語音應(yīng)用進(jìn)行了優(yōu)化,特別是可授權(quán)使用恩智浦完整的語音助手軟件解決方案,包括低延遲,遠(yuǎn)場“喚醒字”檢測、噪聲抑制、回聲消除和語音打斷功能等一系列特性。這顯然會令開發(fā)事半功倍,也讓整個(gè)系統(tǒng)的BOM更為簡化。
  除了核心的主控芯片,整個(gè)基于i.MX RT的語音控制解決方案中還包括其他一些關(guān)鍵元器件,如TFA9894D智能音頻放大器和可選的A71CH安全元件,以及一個(gè)完整的參考BOM,可為客戶提供了一個(gè)從硬件到軟件的完整的交鑰匙解決方案。
圖3.i.MX RT語音控制方案硬件框圖(圖片來源:NXP)
  與Alexa連接
  特別值得一提的是,該方案還可無縫連接Amazon Alexa語音服務(wù)(AVS)平臺,與AVS認(rèn)證軟件、安全性和入門使用完全整合,大幅減少了植入Alexa所需的工程投資,縮短語音控制產(chǎn)品的上市時(shí)間。為此,恩智浦還在美國設(shè)置了實(shí)驗(yàn)室,專門為內(nèi)置Alexa的產(chǎn)品提供測試服務(wù),幫助客戶通過亞馬遜的最終評估。
  實(shí)際上這種增值服務(wù)模式,也是亞馬遜等語音處理平臺提供商所樂見的,因?yàn)檫@有利于其平臺形成一個(gè)更完善的應(yīng)用生態(tài)系統(tǒng),是一個(gè)雙贏的結(jié)果。所以我們也可以想見未來類似的服務(wù)會被復(fù)制到與其他智能語音處理平臺的合作中。
圖4.i.MX RT語音控制方案與AVS整合框圖(圖片來源:安富利)
  總之,這個(gè)基于MCU的語音控制解決方案為開發(fā)者提供了一種“即插即用”式的開發(fā)體驗(yàn),無論是從硬件、軟件,還是與語音處理平臺功能的整合,都能快速搞掂。如果你想在自己的嵌入式產(chǎn)品中加入智能語音處理功能,現(xiàn)在可以“說走咱就走”了。

標(biāo)簽:蘭州 仙桃 湖南 衡水 湘潭 黃山 崇左 銅川

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《語音控制開發(fā)之旅,能不能“說走就走”?》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266