2015年12月28日,國家首個語義庫標(biāo)準(zhǔn)--《智能客服語義庫技術(shù)要求》(標(biāo)準(zhǔn)計劃編號:20151549-T-469)標(biāo)準(zhǔn)啟動會在中國電子技術(shù)標(biāo)準(zhǔn)化研究院(以下簡稱標(biāo)準(zhǔn)院)舉行。本次會議由全國信標(biāo)委組織,工信部信軟司軟件產(chǎn)業(yè)處孫文龍?zhí)庨L,小i機(jī)器人,清華軟件學(xué)院,招商銀行、LG、格蘭仕等單位代表參加了本次會議。
標(biāo)準(zhǔn)研究院趙箐華主任主持會議,作為技術(shù)的提供方小i機(jī)器人與會代表介紹了標(biāo)準(zhǔn)制定的背景、標(biāo)準(zhǔn)應(yīng)用前景、編制計劃等。清華、招行等就標(biāo)準(zhǔn)啟動的相關(guān)內(nèi)容發(fā)表了自己的看法。
沒有語義 人工智能無從談起
人工智能是科技發(fā)展的方向,未來將無所不在。在人工智能涉及到的三大智能技術(shù)中,計算智能領(lǐng)域,計算機(jī)早已超越了人類;感知智能領(lǐng)域,包括語音識別、人臉識別,圖像識別等等,近年,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,已有了長足的進(jìn)展,像語音識別目前技術(shù)在全球已經(jīng)非常成熟,目前已處于產(chǎn)業(yè)的末端。如果說感知智能相當(dāng)于給機(jī)器人裝上了“眼睛”、“耳朵”,那么給予機(jī)器人“大腦”的就是其中最核心的認(rèn)知智能,認(rèn)知智能也就是讓機(jī)器具有“思考”能力的技術(shù),目前還處于起步階段,有很多路需要走。
語義識別是認(rèn)知智能當(dāng)中非常重要的一個環(huán)節(jié),在人與機(jī)器的溝通交互過程中,需要以語義識別技術(shù)來讓機(jī)器明白人類表達(dá)的意思,并根據(jù)理解來給出反饋。而語義的理解正是以知識庫和語義庫來支撐的。這同人類一樣,也是我們與動物的最大區(qū)別,人類能夠不斷的產(chǎn)生知識,并且能夠讓知識傳承下去,這種傳承可以讓我們的下一代不需要在現(xiàn)實中通過實踐學(xué)習(xí)新的知識,而可以通過我們的教育直接獲得,隨著知識面的不斷擴(kuò)充,“思考”能力越來越強(qiáng),機(jī)器也越來越“聰明”。脫離了知識庫和語義庫,語義理解就無從談起。更勿論讓機(jī)器人具有理解、思考的能力,做出正確反饋了。
知識語義、學(xué)習(xí)體系、產(chǎn)業(yè)化 人工智能發(fā)展的正向循環(huán)
認(rèn)知智能作為人工智能的核心,其發(fā)展路徑有別于其他技術(shù)的發(fā)展。一般技術(shù)的發(fā)展路徑為實驗室、小規(guī)模生產(chǎn)、大規(guī)模商業(yè)應(yīng)用、產(chǎn)業(yè)化。但認(rèn)知智能的發(fā)展目前從全球來看,卻是一個技術(shù)、應(yīng)用、產(chǎn)業(yè)化互相促進(jìn)、相輔相成的過程。
“(在一個一個垂直領(lǐng)域的滲透過程中)我們發(fā)現(xiàn):在語義層,不同的行業(yè)之間也是有很多共通的部分,可以被規(guī)則化和結(jié)構(gòu)化。從而可以做一些標(biāo)準(zhǔn)化的東西出來。”小i機(jī)器人總裁兼CTO朱頻頻表示。
小i成立在2001年,最早做聊天機(jī)器人,就像現(xiàn)在的微軟小冰。但聊天功能是無法轉(zhuǎn)化為商業(yè)價值的,于是小i開始往垂直方向發(fā)展,把積累的語義理解的技術(shù),應(yīng)用到垂直領(lǐng)域,教給機(jī)器人一個行業(yè)、一個行業(yè)的垂直的知識,這樣,它就成為一個行業(yè)的專家,可以回答行業(yè)的相關(guān)問題,為企業(yè)創(chuàng)造價值。這就是虛擬客戶助理(VCA),也就是虛擬的客戶服務(wù)機(jī)器人。這條路是小i在市場的考驗下,一步一步走出來的,卻正與智能機(jī)器人技術(shù)全球發(fā)展的路徑不謀而合。
在全球知名的調(diào)研機(jī)構(gòu)Gartner的分類中,虛擬助理應(yīng)用分為虛擬個人助理(VPA)和虛擬客戶助理(VCA)。對于VPA,Gartner認(rèn)為還處于技術(shù)的早期,離實用性還非常遠(yuǎn),從全球范圍內(nèi),真正具有自然語言交互能力的VPA投入大規(guī)劃的商用,需要5-10年,甚至更長的時間。像上文提到的微軟小冰、蘋果Siri以及類似的語音助手都屬于VPA。VCA的機(jī)制和底層技術(shù)類似,但是專注在一個領(lǐng)域或多個領(lǐng)域,因此實用性大大增加,已經(jīng)進(jìn)入產(chǎn)業(yè)化的前期。而VCA解決方案提供商中應(yīng)用領(lǐng)域最多,最具研究價值的正是中國的小i機(jī)器人。
小i現(xiàn)在服務(wù)的用戶超過5億,每年有數(shù)百億次的對話,這使得小i在多個行業(yè)沉淀了強(qiáng)大的領(lǐng)域知識庫和語義庫。而每年數(shù)百億的交互量,會產(chǎn)生出海量的真實數(shù)據(jù),然后通過學(xué)習(xí)體系和算法對這些數(shù)據(jù)進(jìn)行處理,就會不斷的挖掘并學(xué)習(xí)到新的知識和語義,而新習(xí)得的知識和語義,反過來讓智能機(jī)器人系統(tǒng)表現(xiàn)的更加出色,智能化程度更高,表現(xiàn)的更為“聰明”。
用國家標(biāo)準(zhǔn)促人工智能快速發(fā)展
參與語義庫標(biāo)準(zhǔn)制定工作的招行、LG、格蘭仕等都是在各自的行業(yè)中,成功運用人工智能提升服務(wù)品質(zhì)的代表。有別于互聯(lián)網(wǎng)上的通用知識,行業(yè)的這些數(shù)據(jù),在互聯(lián)網(wǎng)上是找不到的,這些知識都存在于企業(yè)內(nèi)部的知識庫中,企業(yè)的文檔中,甚至企業(yè)內(nèi)部的一些人的腦子中,這就是所謂“隱性知識”。知識的積累讓人機(jī)交互更為順暢,標(biāo)準(zhǔn)的制定,可以把已有的這些積累分享出來,讓更多的行業(yè)快速享用新興技術(shù)的利好。
如人工智能依據(jù)數(shù)據(jù)、算法,產(chǎn)業(yè)化應(yīng)用正向循環(huán)的閉環(huán)來促使發(fā)展一樣,標(biāo)準(zhǔn)的制定與人工智能技術(shù)的進(jìn)步一樣密不可分。智能客服語義庫標(biāo)準(zhǔn)是以技術(shù)和產(chǎn)業(yè)應(yīng)用為基礎(chǔ),而通過在技術(shù)在實踐中的實施,必將更好、更快的創(chuàng)造出更多新的應(yīng)用領(lǐng)域;同時,技術(shù)標(biāo)準(zhǔn)在實施的過程中,經(jīng)過市場的不斷檢驗和反饋,必定會加速技術(shù)的發(fā)展和完善。
智能客服語義庫提供的是一套對通用和行業(yè)領(lǐng)域知識的共享和共同認(rèn)識,形成統(tǒng)一標(biāo)準(zhǔn)后,能有效降低構(gòu)建機(jī)器人服務(wù)系統(tǒng)的復(fù)雜度和建設(shè)成本,極大的節(jié)省相關(guān)企業(yè)的前期投入,加速智能服務(wù)機(jī)器人在更多行業(yè)的快速落地,隨著智能機(jī)器人在更多行業(yè)、更多領(lǐng)域的普及,使其具有普遍性時,那么人類離幻想中無所不能的機(jī)器人也就更加接近了。小i機(jī)器人聯(lián)合中國電子技術(shù)標(biāo)準(zhǔn)研究院,啟動智能客服語義庫國家標(biāo)準(zhǔn)建立工作,以客服為出發(fā)點,提升智能人機(jī)交互技術(shù)水平,更快擁抱即將進(jìn)入的機(jī)器人時代。