英國東英吉利大學日前發(fā)布的新成果顯示,該校研究人員開發(fā)的新型視覺語音識別系統(tǒng)能像專業(yè)人員那樣識別唇語,且識別度更精確,未來在案件偵查以及輔助聽力和語言有障礙的人士方面具有廣泛用途。
據(jù)新華網(wǎng)29日消息,據(jù)研究人員介紹,無論是專業(yè)人士還是現(xiàn)有的視覺語音電腦識別系統(tǒng),在讀唇語時一個最大挑戰(zhàn)是如何區(qū)別容易混淆的發(fā)音,如英文中“p”、“b”、“m”發(fā)音時,唇部動作都非常相似,很難區(qū)別。但最新開發(fā)的電腦系統(tǒng)利用特別設計的程序,能分辨出圖像中唇部最細微的變化,并且完全不需要語音信息輔助。
參與這項研究的東英吉利大學學者海倫·貝爾說,發(fā)“p”、“b”、“m”這樣的音時,唇部動作還是會有肉眼不易察覺的差別,這款電腦程序會不斷學習和積累相似發(fā)音的唇部動作,并進行相關分類,從而不斷提高識別的精確度。
貝爾表示,未來經(jīng)過進一步優(yōu)化,這一系統(tǒng)能夠運用在多個領域中,除了用來幫助有聽力和語言障礙的人士,相關技術也會對人工智能的發(fā)展起到很好的助推作用。