編者按:機器對人類語言的理解一直都是前沿研究的難點,理解語言不僅是語音識別,還有語法、語境、語用、俗語等一系列的綜合。一個很著名的例子是AI不能根據(jù)語境分辨“The book can't fit the suitcase because it is too small.。”的真正含義。人工智能要真正實現(xiàn)與人類的自由交談,還有很長一段路要走。這篇原題為Facebook Wants to Make Chatbots More Conversational>的文章介紹了Facebook在這方面做出的努力——他們?yōu)锳I研究者提供了一個訓(xùn)練AI語言能力的專業(yè)平臺,希望能以此加速聊天機器人的研究。
盡管在過去幾年關(guān)于聊天機器人(chatbots)的討論——關(guān)于它是如何革命性地改變了移動設(shè)備傳達信息的方式,使網(wǎng)購和顧客服務(wù)變得更加簡單快捷——一直不絕,這些人工智能應(yīng)用軟件始終不能很好地運用在與人對話上。這是因為要實現(xiàn)機器與人類之間的無障礙交流,研究還有很長的一段路要走。Facebook創(chuàng)造了一個訓(xùn)練機器人對話系統(tǒng)的共享平臺,希望能藉此改變這個局面。
運用自動電腦程序的聊天機器人通常被用在顧客咨詢服務(wù)上,或是充當(dāng)智能手機上的私人助理。這些聊天機器人的對話通常是被提前編程好的,F(xiàn)acebook人工智能研究(FAIR)團隊的主管Yann LeCun說。“如果你關(guān)閉編程功能,他們就不能很好地完成工作。”其他類型的聊天機器人則用于休閑目的,但不適用于明確的指令,他補充道,引用了微軟去年在推特上推出的Tay AI的例子,Tay AI在它“學(xué)會”了發(fā)送有敵意的推文后被火速下線。LeCun說:
我們?nèi)鄙倌欠N能真正‘學(xué)會’什么有益的事情的聊天機器人。
LeCun和他的團隊的工作是運用一個名叫ParlAI的軟件來幫助程序員開發(fā)下一代智能機器人,在ParlAI的平臺上,開發(fā)者可以得到共享、開放、互利的AI訓(xùn)練信息。開發(fā)AI的其中一個重要的目標(biāo)是創(chuàng)造能與人類正常交談的智能網(wǎng)絡(luò),Jason Weston說道,他也是FAIR團隊中的一員。
現(xiàn)在的技術(shù)不到位是因為相關(guān)的研究領(lǐng)域在這方面仍有空白,比如讓AI使用自然語言對話的算法還不到位。
ParlAI發(fā)布了20個不同的數(shù)據(jù)組,每一種研究者都可以用來訓(xùn)練AI對話系統(tǒng)完成一個特定的任務(wù),可能是學(xué)習(xí)回答問題,或是收集相關(guān)信息(比如訂餐任務(wù))。其中一組,被稱為bAbl任務(wù),涵蓋了20種不同的測試,用于衡量AI軟件理解和推斷文本的能力。Weston說,AI需要理解對方提問的是什么,并運用邏輯來回答問題。
LeCun說,一些數(shù)據(jù)組僅僅是測試,另一些則會涵蓋圖形和文本信息,為的是教會AI把詞語與現(xiàn)實生活的中的對象聯(lián)系起來。ParlAI設(shè)計的初衷就是為研究者提供一個訓(xùn)練和測試對話模型的統(tǒng)一的框架,特別是對于把多個數(shù)據(jù)組放到一起對AI進行多任務(wù)的集中訓(xùn)練,他補充說,“我們希望這種組合能夠幫助機器一次性得到更多知識。”
在機器學(xué)習(xí)和對話系統(tǒng)上的強調(diào)已經(jīng)成了領(lǐng)域內(nèi)的共識,并非Facebook的研究人員,在MIT信息科學(xué)與人工智能實驗室交互機器人小組的博士后研究員Brad Hayes說,
理解語言是一個非常宏大的話題,創(chuàng)造強功能性的聊天機器人不僅需要了解語言背后的意義,還需要機器人具備同時對相關(guān)的反饋進行反應(yīng)的能力。
公開這些數(shù)據(jù)組能夠讓更多的研究人員參與進來,從而解決現(xiàn)有問題。但是Hayes表示,除了要將更多的訓(xùn)練數(shù)據(jù)納入現(xiàn)有系統(tǒng)以外,要發(fā)展出更加成功的AI語言理解系統(tǒng)并運用到實際,科研人員還需要付出更多。現(xiàn)有系統(tǒng)的局限性很明顯的體現(xiàn)在用戶為了使聊天機器人比如亞馬遜的Alexa聽得懂自己的話,經(jīng)常會使用更簡單的表述方式。他說,“舉個很貼切的例子,你可以問Alexa把音量調(diào)大或者調(diào)小,或是告訴它按1到10的量級進行設(shè)定,但是它聽不懂百分比的表述,因為它的內(nèi)部軟件沒有提前設(shè)定過這種說法。”程序員可能將重點放在猜測客戶的用語上,而不是力圖設(shè)計一個更自然的交互系統(tǒng),這是我們目前AI發(fā)展的一個潛在風(fēng)險。
Facebook試圖解決這個問題的一個方法是允許ParlAI參與者通過與真人交互的方式來測試人工智能應(yīng)用程序的對話功能,該機制是通過亞馬遜機械通訊社(Amazon Mechanical Turk)來進行的,該機構(gòu)是一個眾包平臺,人類智慧被用來執(zhí)行計算機目前無法做到的任務(wù)聊天機器人和AI助理的能力取決于他們是如何被設(shè)計和訓(xùn)練的,這需要研究人員了解他們是如何與真人互動的,Weston說。
一個完善的聊天機器人發(fā)展策略對于技術(shù)的發(fā)展是至關(guān)重要的。當(dāng)未來自動對話系統(tǒng)被應(yīng)用到更加廣泛的領(lǐng)域,聊天機器人對于未來信息傳播和前沿服務(wù)會有更加重要的意義。Hayes說,“聊天機器人會極大地改進用戶服務(wù)系統(tǒng),節(jié)省公司的人力資源。但是如果在技術(shù)還未完全成熟之際就投放使用,也有破壞用戶體驗和品牌聲譽的潛在可能。”