主頁 > 知識庫 > 云端語音識別

云端語音識別

熱門標(biāo)簽:蘋果 Win7旗艦版 科大訊飛語音識別系統(tǒng) 鐵路電話系統(tǒng) 阿里云 解決方案 電銷機(jī)器人 Linux服務(wù)器
  語音識別是將語音即時的轉(zhuǎn)換成文字,而這音源是源自麥克風(fēng)或是其它的音訊來源,將其音訊傳送到伺服器運(yùn)算處理或是本地運(yùn)算辨識。而當(dāng)將音訊傳送到伺服器時,可得到回傳的辨識結(jié)果,例如文字或是解析音訊的意圖;例如“臺北市的天氣“等等。而當(dāng)應(yīng)用程式回應(yīng)使用者時,此時需要將文字轉(zhuǎn)換成語音。
  在將語音串流進(jìn)入辨識前,需要做雜音抑制處理,如果這部分沒有處理好,會降低系統(tǒng)的辨識率;例如在安靜的環(huán)境下,辨識率是很高的,而在雜音較多的地方,是不是也能確實做到語音識別呢?
  如何的保持聲音的品質(zhì)呢?將噪音消除,可以透過降噪的處理方式,如下圖:
  在降噪的技術(shù)里有Feedback ANC及Feed-Forward ANC等等,而這噪音的調(diào)校又會跟本身的機(jī)構(gòu)、麥克風(fēng)的位置、方向是息息相關(guān),缺一不可。
  當(dāng)正確取得聲音串流時,后續(xù)就是選擇語音的辨識伺服器,以Google所提供的平臺為例,它提供了一系列的Cloud Speech API,讓使用者可以輕松的應(yīng)用語音識別的控制。
  而將聲音串流錄制并傳送到伺服器及進(jìn)行本地的語音回應(yīng)輸出、控制;這時你需要一個強(qiáng)而有力的控制平臺,想當(dāng)然爾,大多數(shù)會選擇Linux平臺,可以快速的取得相關(guān)的資源并連結(jié)網(wǎng)路,所以在挑選Linux開發(fā)平臺時,最重要的要確認(rèn)平臺是否有持續(xù)支援Linux main line,這是一個非常重要的指標(biāo),以確保你的Linux平臺是可以持續(xù)的支援新的Linux版本。
  Microchip的產(chǎn)品SAMA5D2系列提供Linux開發(fā)平臺及及豐富周邊控制模組,讓你可以快速的建立產(chǎn)品應(yīng)用。而為了縮短使用者的開發(fā)時間,也提供SoM的開發(fā)平臺,這可以大大的降低使用者的開發(fā)時間及硬體的設(shè)計難度。
  未來全球語音識別市場將會變得更加多樣化,同時軟體準(zhǔn)確度上會有大幅提升。
  在醫(yī)療領(lǐng)域的應(yīng)用:
  不僅是簡單的通過智慧手表追蹤運(yùn)動情況和心率,還有直接根據(jù)人的身體狀況匹配相應(yīng)的服務(wù)如合適的餐廳或食物等,當(dāng)然這些大多是基于穿戴式設(shè)備的。另外他們還考慮到更多場景,諸如緊急語音求助,醫(yī)患對話存檔,呼叫中心的對話聽寫等。由于醫(yī)療領(lǐng)域詞匯庫專業(yè)性強(qiáng)演變性弱,只要建立完整的數(shù)據(jù)庫,就可以做到對疾病名稱、藥品名稱相對精確的識別。
  在智慧車載的應(yīng)用:
  行車安全問題上一直聚焦了很多目光,去年有人曾經(jīng)設(shè)計出一個車載屏幕,可以利用多指的簡單手勢解決司機(jī)操作觸控螢?zāi)贿^度分散注意力的問題。通過將車載平臺與手機(jī)連接,可以幫用戶實現(xiàn)語音控制GPS導(dǎo)航,訊息收發(fā),電話接打,社群網(wǎng)路更新等等。

標(biāo)簽:湖州 呼倫貝爾 湘西 安陽 三門峽 畢節(jié) 邵陽 辛集

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《云端語音識別》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266