主頁 > 知識庫 > 電話機(jī)器人架構(gòu)圖(智能電話機(jī)器人)

電話機(jī)器人架構(gòu)圖(智能電話機(jī)器人)

熱門標(biāo)簽:地圖標(biāo)注網(wǎng)點(diǎn) js百度地圖標(biāo)注樣式 知乎智能電話機(jī)器人 德州智能電銷機(jī)器人 長城地圖標(biāo)注 度言 電銷機(jī)器人 默納克系統(tǒng)無外呼顯示 長沙電銷外呼系統(tǒng)業(yè)務(wù) 圖片添加地圖標(biāo)注

本文目錄一覽:

1、電銷機(jī)器人是什么? 2、電話機(jī)器人是什么? 3、聊天機(jī)器人概述 4、打電話的機(jī)器人? 5、騰訊算法高級研究員陳松堅(jiān):智能問答技術(shù)及其應(yīng)用 電銷機(jī)器人是什么?

 電銷機(jī)器人,是一種AI機(jī)器人智能語音呼叫系統(tǒng),是一種智能電話機(jī)器人,模仿真人打電話,真人語音,每天拔打電話量高達(dá)2000到3000不等,工作效率非常高。當(dāng)今房地產(chǎn)、金融、貸款、保險(xiǎn)、裝修等行業(yè)都非常適合使用電銷機(jī)器人。

為各電銷行業(yè)提供一款全自動(dòng)化電話機(jī)器人架構(gòu)圖的智能電銷機(jī)器人

1、可以自動(dòng)直找客戶號碼,自動(dòng)找手機(jī)號碼;

2、智能設(shè)置自動(dòng)執(zhí)行每天撥打任務(wù)安排,實(shí)現(xiàn)自動(dòng)撥打號碼;

3、支持本人語音話術(shù)錄制,實(shí)時(shí)訓(xùn)練全程智能應(yīng)答,真實(shí)真人智能交流,介紹產(chǎn)品等公司相關(guān)業(yè)務(wù);

4、語境語意即時(shí)算法,準(zhǔn)確捕捉客戶意圖,實(shí)現(xiàn)自動(dòng)判斷智能回復(fù);

5、靈活多變電話機(jī)器人架構(gòu)圖的締結(jié)方式,自動(dòng)引導(dǎo)客戶需求;

6、綜合分析通話內(nèi)容,智能標(biāo)識用戶需求,自動(dòng)對接人工坐席,實(shí)現(xiàn)自動(dòng)轉(zhuǎn)接;

7、根據(jù)預(yù)設(shè)客戶意向標(biāo)注,自動(dòng)匹配判斷客戶意向需求;

8、通過過程自動(dòng)錄音,自動(dòng)歸類,自動(dòng)統(tǒng)計(jì)時(shí)長,自動(dòng)推送工作報(bào)告,實(shí)現(xiàn)客戶智能分類管理;

9、自動(dòng)設(shè)定約訪,回訪時(shí)間,自動(dòng)啟動(dòng)電話回訪或提醒人員根據(jù),實(shí)現(xiàn)意向客戶自動(dòng)跟蹤.

 

電話機(jī)器人是什么?

電話機(jī)器人主要就是用來模擬人工通話電話機(jī)器人架構(gòu)圖的一組程序電話機(jī)器人架構(gòu)圖,一般由電話機(jī)器人架構(gòu)圖,CRM系統(tǒng)電話機(jī)器人架構(gòu)圖,語義識別,轉(zhuǎn)換文字,話術(shù)體系,這是軟的部分,再加上底層軟交換和通信模塊一起,合并起來就是一套完整的電話機(jī)器人系統(tǒng)。

聊天機(jī)器人概述

聊天機(jī)器人,是一種通過自然語言模擬人類,進(jìn)而與人進(jìn)行對話電話機(jī)器人架構(gòu)圖的程序。

1950年,圖靈(Alan M. Turing)在 Mind 期刊上發(fā)表的文章 Computer Machinery and Intelligence ,這篇文章開篇就提出了“機(jī)器能思考嗎?(Can machines think?)”的設(shè)問,提出了經(jīng)典的 圖靈測試(Turing Test) 。通過圖靈測試被認(rèn)為是人工智能研究的終極目標(biāo),圖靈本人也因而被稱為 “人工智能之父” 。

1966年,最早的聊天機(jī)器人程序 ELIZA 誕生,由麻省理工(MIT)的約瑟夫·魏澤鮑姆(Joseph Weizenbaum)開發(fā),開發(fā)用于臨床模擬羅杰斯心理治療的 BASIC腳本程序 。實(shí)現(xiàn)技術(shù)僅為對用戶輸入計(jì)算機(jī)的話語做關(guān)鍵詞匹配,并且回復(fù)規(guī)則是由人工編寫的。

1972年,美國精神病學(xué)家肯尼思·科爾比(Kenneth Colby)在斯坦福大學(xué)(Standford University)使用 LISP 編寫了模擬偏執(zhí)型精神分裂癥表現(xiàn)的計(jì)算機(jī)程序 PARRY 。

1988年,英國程序員羅洛·卡彭特(Rollo Carpenter)創(chuàng)建了聊天機(jī)器人 Jabberwacky ,項(xiàng)目目標(biāo)是“以有趣、娛樂和幽默的方式模擬自然的人機(jī)聊天”,這個(gè)項(xiàng)目也是通過與人類互動(dòng)創(chuàng)造人工智能聊天機(jī)器人的早期嘗試,但 Jabberwacky 并未被用于執(zhí)行任何其電話機(jī)器人架構(gòu)圖他功能。技術(shù)是使用 上下文模式匹配技術(shù) 找到最合適的回復(fù)內(nèi)容。

1988年,加州大學(xué)伯克利分校(UC Berkeley)的羅伯特·威林斯基(Robert Wilensky)等人開發(fā)了名為UC(UNIX Consultant)的聊天機(jī)器人系統(tǒng)。UC聊天機(jī)器人目的是幫助用戶學(xué)習(xí)UNIX操作系統(tǒng)。

1990年,美國科學(xué)家兼慈善家休·勒布納(Hugh G. Loebner)設(shè)立了人工智能年度比賽------勒布納獎(jiǎng)(Loebner Prize)。勒布納獎(jiǎng)旨在借助交談測試機(jī)器的思考能力,它被看做對圖靈測試的一種時(shí)間,其比賽的獎(jiǎng)項(xiàng)分為金、銀、銅三等。目前為止,尚無參賽程序達(dá)到金獎(jiǎng)或銀獎(jiǎng)標(biāo)準(zhǔn)。

在勒布納獎(jiǎng)的推動(dòng)下,聊天機(jī)器人迎來了研究的高潮,其中較有代表性的聊天機(jī)器人系統(tǒng)是1995年12月23日誕生的 ALICE(Artificial Linguistic Internet Computer Entity) 。隨著 ALICE 一同發(fā)布的 AIML(Artifical Intelligence Markup Language) 目前在移動(dòng)端虛擬助手的開發(fā)中得到了廣泛的應(yīng)用。

2001年,SmarterChild在短信和即時(shí)通信工具中廣泛流行,使得聊天機(jī)器人第一次被應(yīng)用在了即時(shí)通信領(lǐng)域。2006年,IBM開始研發(fā)能夠用自然語言回答問題的最強(qiáng)大腦 Watson ,作為一臺(tái)基于IBM“深度問答”技術(shù)的超級計(jì)算機(jī), Watson 能夠采用上百種算法在3秒內(nèi)找出特定問題的答案。

2010年,蘋果公司推出了人工智能助手 Siri , Siri 的技術(shù)來源于美國國防部高級研究規(guī)劃局公布的CALO計(jì)劃:一個(gè)簡化軍方繁復(fù)事務(wù),且具備學(xué)習(xí)、組織及認(rèn)知能力的虛擬助理。CALO計(jì)劃衍生出來的民用版軟件就是 Siri虛擬個(gè)人助理 。

此后,微軟小冰、微軟Cortana(小娜)、阿里小蜜、京東JIMI、網(wǎng)易七魚等各類聊天機(jī)器人層出不窮,并且這些聊天機(jī)器人逐漸滲透進(jìn)人們生活的各個(gè)領(lǐng)域。

2016年,全國各大公司開始推出可用于聊天機(jī)器人系統(tǒng)搭建的開放平臺(tái)或開源架構(gòu)。

2010年至今,標(biāo)志性的聊天機(jī)器人產(chǎn)品如下圖所示。

總結(jié):隨著人工智能相關(guān)技術(shù)“東風(fēng)”漸起,自然語言處理研究碩果頗豐,聊天機(jī)器人相關(guān)技術(shù)迅速發(fā)展。同時(shí),聊天機(jī)器人作為一種新穎的人機(jī)交互方式,正在成為移動(dòng)搜索和服務(wù)的入口之一,畢竟搜索引擎的最終形態(tài)很可能就是 聊天機(jī)器人 。眾多人工智能領(lǐng)域的探索者和開發(fā)者都想緊緊抓住并搶占聊天機(jī)器人這一新的交互入口。

下面從幾個(gè)維度對齊進(jìn)行分類介紹。

在線客服聊天機(jī)器人系統(tǒng) 的主要功能是自動(dòng)回復(fù)用戶提出的與產(chǎn)品或服務(wù)相關(guān)的問題,以降低企業(yè)客服運(yùn)營成本、提升用戶體驗(yàn)。代表性的商用在線客服聊天機(jī)器人系統(tǒng)有小i機(jī)器人、京東JIMI客服機(jī)器人、阿里小蜜等。以京東JIMI客服機(jī)器人為例,用戶可以通過與JIMI聊天了解商品的具體信息、了解平臺(tái)的活動(dòng)信息、反饋購物中存在的問題等。另外,JIMI具有一定的 拒識能力 ,因此可以知道用戶的哪些問題時(shí)自己無法回答的,且可以及時(shí)將用戶轉(zhuǎn)向人工客服。阿里巴巴集團(tuán)在2015年7月24日發(fā)布了一款人工智能購物助理虛擬機(jī)器人,取名為“阿里小蜜”,阿里小蜜基于客戶需求所在的垂直領(lǐng)域(服務(wù)、導(dǎo)購、助手等),通過“智能+人工”的方式提供良好的客戶體驗(yàn)。

娛樂場景下聊天機(jī)器人系統(tǒng) 的主要功能是同用戶進(jìn)行不限定主題的對話(閑聊),從而起到陪伴、慰藉等作用。其應(yīng)用場景集中在社交媒體、兒童陪伴及娛樂、游戲陪練等領(lǐng)域。有代表作的系統(tǒng)如微軟的“小冰”、微信的“小微”、北京龍泉寺的“賢二機(jī)器僧”的等。

教育場景下的聊天機(jī)器人系統(tǒng) 可以根據(jù)教育內(nèi)容的不同進(jìn)一步劃分。這類聊天機(jī)器人的應(yīng)用場景為具備人機(jī)交互功能的學(xué)習(xí)、培訓(xùn)類產(chǎn)品,以及兒童智能玩具等。

個(gè)人助理類 應(yīng)用可以通過語音或文字與用戶進(jìn)行交互,實(shí)現(xiàn)用戶個(gè)人事務(wù)的查詢及代辦,如天氣查詢、短信手法、定位及路線推薦、鬧鐘及日程提醒、訂餐等,從而讓用戶可以更便捷地處理日常事務(wù)。

智能問答類 聊天機(jī)器人系統(tǒng)可以回答用戶以自然語言形式提出的事實(shí)型問題及其電話機(jī)器人架構(gòu)圖他需要計(jì)算和邏輯推理的復(fù)雜問題,以滿足用戶的信息需求并起到輔助用戶決策的目的。不僅要考慮如 What、Who、Which、Where、When 等事實(shí)型問答,也要考慮如 How、Why 等非事實(shí)型問答,因此智能回答的聊天機(jī)器人通常作為聊天機(jī)器人的一個(gè)服務(wù)模塊。

從實(shí)現(xiàn)的角度來看,聊天機(jī)器人可以分為 檢索式 和 生成式 。檢索式聊天機(jī)器人的回答是提前定義的,在聊天時(shí)機(jī)器人使用規(guī)則引擎、模式匹配或者機(jī)器學(xué)習(xí)訓(xùn)練好的分類器從知識庫中挑選一個(gè)最佳的回復(fù)展示給用戶。生成式聊天機(jī)器人不依賴于提前定義的回答,但是在訓(xùn)練機(jī)器人的過程中,需要大量的語料,語料包含上下文聊天信息和回復(fù)。

盡管目前在具體生產(chǎn)環(huán)境中,提供聊天服務(wù)的一般都是基于檢索的聊天機(jī)器人系統(tǒng),但是基于深度學(xué)習(xí)Seq2Seq模型的出現(xiàn)可能使基于生成的聊天機(jī)器人系統(tǒng)成為主流。

基于功能的聊天機(jī)器人可以分為問答系統(tǒng)、面向任務(wù)的對話系統(tǒng)、閑聊系統(tǒng)和主動(dòng)推薦系統(tǒng)4種。

目前,對問答系統(tǒng)和主動(dòng)推薦系統(tǒng)的評價(jià)指標(biāo)較為客觀,評價(jià)方式也相對成熟。而面向任務(wù)的對話系統(tǒng)和餡料系統(tǒng),在給定相同輸入的情況下,系統(tǒng)回復(fù)形式可以多種多樣,對于用戶的同一輸入,通常有多種合理且數(shù)目不固定的回復(fù),這使得很難通過一種客觀的機(jī)制對其進(jìn)行評價(jià),所以在評價(jià)時(shí)需要加入人的主觀判斷作為評價(jià)的依據(jù)之一。

通常,一個(gè)完整的聊天機(jī)器人系統(tǒng)框架如圖,其主要包含自動(dòng)語音識別、自然語言理解、對話管理、自然語言生成、語音合成5個(gè)主要的功能模塊。需要指出的是,并不是所有的聊天機(jī)器人系統(tǒng)都需要語音技術(shù)。

例如,以文字方式實(shí)現(xiàn)人機(jī)交互的聊天機(jī)器人系統(tǒng),就不需要自動(dòng)語音識別模塊和語音合成模塊。

Amazon Lex是一種可以在任何程序中使用語音和文本構(gòu)建對話界面的服務(wù)。Amazon Lex提供可擴(kuò)展、安全且易于使用的端到端(end2end)解決方案,以構(gòu)建、發(fā)布和監(jiān)控開發(fā)人員發(fā)布的機(jī)器人。下圖展示了聊天機(jī)器人如何通過對話的方式協(xié)助用戶完成訂花的需求。

另一個(gè)典型的聊天機(jī)器人框架是Facebook的Wit.ai。Wit.ai積累了大量高質(zhì)量的對話數(shù)據(jù),有效促進(jìn)了聊天機(jī)器人系統(tǒng)的發(fā)展,并通過將人工智能和人類智能結(jié)合,進(jìn)一步提升了聊天機(jī)器人的智能水平。

聊天機(jī)器人的4種分類,包括 問答系統(tǒng)、面向任務(wù)的對話系統(tǒng)、閑聊系統(tǒng)和主動(dòng)推薦系統(tǒng)。

Siri被定位為面向任務(wù)的對話系統(tǒng),為用戶提供打電話、訂餐、訂票、放音樂等服務(wù)。Siri對接了很多服務(wù),且設(shè)置了 “兜底” 操作,當(dāng)Siri無法理解用戶的輸入時(shí)就命令搜索引擎返回相關(guān)的服務(wù)。Siri的出現(xiàn)引領(lǐng)了移動(dòng)終端個(gè)人事務(wù)助理的商業(yè)化發(fā)展潮流。

下圖是Siri的技術(shù)框架:

2011年2月,IBM耗資3000萬美元研發(fā)的IBM Watson登上了美國著名智力問答競賽節(jié)目《危險(xiǎn)邊緣》(Jeopardy),面對節(jié)目中充滿雙管意思的英文問題,IBM Watson能做出分析并在龐大的自然語言知識庫中尋找線索,將這些線索組合成答案。最終,IBM Watson壓倒性地優(yōu)勢擊敗了節(jié)目中最聰明的人腦,同時(shí)創(chuàng)下了這個(gè)知識競賽系列節(jié)目27年歷史上的最高分。IBM Watson作為IBM公司研發(fā)的問答系統(tǒng),集成了自然語言處理、信息檢索、知識表示、自動(dòng)推理、機(jī)器學(xué)習(xí)等多項(xiàng)技術(shù)的應(yīng)用,形成了假設(shè)認(rèn)知和大規(guī)模的證據(jù)搜集、分析、評價(jià)的深度問答技術(shù)。IBM Watson可以分析自然語言形式的數(shù)據(jù),通過大規(guī)模學(xué)習(xí)和推理,為用戶提供個(gè)性化服務(wù)。

2012年7月9日,谷歌發(fā)布了智能個(gè)人助理Google Now。Google Now通過自然語言交互方式為用戶提供頁面搜索、自動(dòng)指令等功能。Allo是谷歌在前述工作的基礎(chǔ)上發(fā)布的語音助手。Allo具備隨時(shí)間推移學(xué)習(xí)用戶行為的能力。

2014年4月2號

主動(dòng)推薦系統(tǒng)采用的是一種實(shí)現(xiàn)個(gè)性化信息推送的技術(shù)方式。主動(dòng)推薦系統(tǒng)并不需要用戶提供明確的需求,而是通過分析用戶的歷史行為數(shù)據(jù)建立用戶畫像,從而基于用戶畫像主動(dòng)向用戶推薦系統(tǒng)認(rèn)為能夠滿足用戶興趣和需求的信息。在電商購物(如阿里巴巴、亞馬遜)、社交網(wǎng)絡(luò)(如Facebook、微博)、新聞資訊(如今日頭條)、音樂電影(如網(wǎng)易云音樂、豆瓣)等領(lǐng)域均有廣泛而成功的應(yīng)用。主動(dòng)推薦系統(tǒng)本質(zhì)上是一項(xiàng)幫助人們解決信息過載(information overload)問題的工具。所謂信息過載,是指用戶真正需求、真正感興趣的東西被淹沒在其同類物品的海洋里。 主動(dòng)的交互方式能夠顯著提升用戶體驗(yàn),且機(jī)器人主動(dòng)交互的方式更接近真實(shí)的人與人之間的對話方式,使得對話更自然。

一種主動(dòng)推薦的方式,是基于 知識圖譜(Knowledge Graph) 的主動(dòng)推薦系統(tǒng)。例如,在建立音樂領(lǐng)域的主動(dòng)推薦系統(tǒng)時(shí),可以先建立音樂領(lǐng)域知識圖譜和用戶知識圖譜,然后在進(jìn)行用戶信息搜索的過程中建立起用戶的音樂喜好畫像,從而更精準(zhǔn)地對用戶進(jìn)行音樂推送。

從圖中可看出,在用戶點(diǎn)播歌曲的過程中,主動(dòng)推薦系統(tǒng)可以結(jié)合音樂知識圖譜、用戶個(gè)人知識圖譜,以及用戶的歷史對話數(shù)據(jù),綜合給出最優(yōu)的音樂推薦。

主動(dòng)推薦系統(tǒng)與問答系統(tǒng)、面向任務(wù)的對話系統(tǒng)和閑聊系統(tǒng)被認(rèn)為是聊天機(jī)器人產(chǎn)品的4種主要分類。

打電話的機(jī)器人?

打電話的機(jī)器人俗稱“電話機(jī)器人”,是一款通過精準(zhǔn)語言平臺(tái),群呼潛在客戶群體,并模擬銷售專員溝通進(jìn)行信息篩選的人工智能語音機(jī)器人。

電話機(jī)器人在普通呼叫系統(tǒng)基礎(chǔ)上加入了自然語言處理、語音識別、詞義理解等多項(xiàng)人工智能技術(shù),通過智能外呼,自動(dòng)應(yīng)答來代替人工接打電話,達(dá)到篩選意向客戶、鎖定目標(biāo)客戶、精準(zhǔn)客戶分類等等營銷服務(wù)目的,提升客戶體驗(yàn)、提高營銷效率、優(yōu)化運(yùn)營成本、助力企業(yè)降本增效。

騰訊算法高級研究員陳松堅(jiān):智能問答技術(shù)及其應(yīng)用

隨著人工智能電話機(jī)器人架構(gòu)圖的飛速發(fā)展以及廣泛落地應(yīng)用電話機(jī)器人架構(gòu)圖,越來越多電話機(jī)器人架構(gòu)圖的設(shè)備將會(huì)被植入智能問答技術(shù)電話機(jī)器人架構(gòu)圖,人機(jī)交互場景隨處可見,智能問答在未來將會(huì)成為一個(gè)非常重要的入口。

騰訊小知憑借著業(yè)界領(lǐng)先的智能AI引擎算法和海量大數(shù)據(jù)倉庫,已將智能問答技術(shù)落地實(shí)施,并且經(jīng)過大量的業(yè)務(wù)考驗(yàn)和優(yōu)化,知識點(diǎn)匹配度和準(zhǔn)確率都已達(dá)到90%以上,在2018 年 GITC 全球互聯(lián)網(wǎng)技術(shù)大會(huì)上,騰訊小知榮獲年度互聯(lián)網(wǎng)最具價(jià)值產(chǎn)品獎(jiǎng)。

騰訊小知算法負(fù)責(zé)人陳松堅(jiān)也在會(huì)場發(fā)表了關(guān)于智能問答技術(shù)原理及其在To B場景下的應(yīng)用的專題演講,從自己的角度為電話機(jī)器人架構(gòu)圖我們展現(xiàn)智能問答技術(shù)的最新成果。

他首先從智能問答是什么,為什么和怎么做的三個(gè)問題出發(fā),闡明了他對當(dāng)前智能問答技術(shù)的定位和價(jià)值,首先,現(xiàn)階段的智能問答是信息檢索技術(shù)的升級,是量變而未達(dá)到質(zhì)變。但是無論在To B還是To C的場景下,當(dāng)前的技術(shù)都能夠切實(shí)解決一些用戶的痛點(diǎn),提升用戶體驗(yàn),是亟待推進(jìn)和充滿想象的方向。

在回答怎么做這個(gè)問題時(shí),他詳細(xì)介紹了幾種不同的問答機(jī)器人的實(shí)現(xiàn)路徑,包括單輪問答機(jī)器人,多輪問答機(jī)器人及閱讀理解機(jī)器人。其中重點(diǎn)闡述了單輪問答機(jī)器人的實(shí)現(xiàn)原理,包括字面匹配,詞向量匹配,深度語義匹配,遷移學(xué)習(xí)等技術(shù)。

此后他還分享了小知團(tuán)隊(duì)將上述技術(shù)產(chǎn)品化的經(jīng)驗(yàn),包括智能客服機(jī)器人和電話機(jī)器人兩大塊,主要分享了當(dāng)前產(chǎn)品的形態(tài),亮點(diǎn)和實(shí)際項(xiàng)目中取得的一些成果。

最后,他簡單總結(jié)了小知目前完成的工作以及就智能問答的發(fā)展提出了自己的幾點(diǎn)看法。

--------------------------------------------------------------

以下是演講稿全文:

各位下午好,很高興今天能在這里給大家做分享報(bào)告。先介紹一下,我們騰訊小知是致力于為政府和各行業(yè)提供一攬子智能問答解決方案的團(tuán)隊(duì),目前已經(jīng)落地的包括基于文本的智能客服機(jī)器人和基于語音的電話機(jī)器人等。

在大多數(shù)人的認(rèn)知里,智能問答很可能是以上的3個(gè)印象,2011年打敗了人類取得問答競賽冠軍的waston;2017年被沙特授予公民身份的機(jī)器人sofia;更為大家熟知的鋼鐵俠中的機(jī)器人管家jarvis。在大家心目中,智能就意味著能夠像真人一樣交流。然而作為從業(yè)者,很遺憾地告訴大家,目前的技術(shù)還遠(yuǎn)沒有達(dá)到這個(gè)目標(biāo),我認(rèn)為本質(zhì)上目前的智能問答技術(shù)是對信息檢索技術(shù)的一次升級,是量變而未到質(zhì)變。這個(gè)皇冠上的明珠還等待我們?nèi)フ ?/p>

既然問答技術(shù)還不成熟,那為什么還要投身到這個(gè)領(lǐng)域呢。我想從To B和To C兩個(gè)角度去回答。對企業(yè)來講,當(dāng)前的問答技術(shù)雖然無法解答復(fù)雜的咨詢,但是大部分的簡單的頭部問題是可以比較好的解答的。從本輪AI大潮NLP賽道的幾名種子選手都從智能客服這個(gè)方向切入就可以看出企業(yè)是確實(shí)存在對智能問答的剛性需求。而對普通用戶來講,一方面siri等語音助手每天都在為用戶提供便捷的交互界面,另一方面像amazon echo這一類的智能家居產(chǎn)品也逐步進(jìn)入千家萬戶,成為物聯(lián)網(wǎng)生態(tài)的中心入口之一,這便是智能問答的價(jià)值所在。

那如何實(shí)現(xiàn)智能問答機(jī)器人呢?我們先來看最基本的單輪問答機(jī)器人的實(shí)現(xiàn)原理。

熟悉搜索引擎的朋友會(huì)發(fā)現(xiàn)這個(gè)架構(gòu)跟搜索引擎的很類似。單輪問答一般來說就是FAQ問答,是基于業(yè)務(wù)問答對組成的問答庫進(jìn)行檢索匹配。其中FAQ問題集包含多個(gè)相似問法供用戶問題去匹配。預(yù)處理階段一般會(huì)進(jìn)行文本糾錯(cuò),標(biāo)準(zhǔn)化和底層NLP特征提取;召回階段會(huì)在倒排索引中召回若干個(gè)候選問題(粗排),而最后的匹配階段會(huì)基于各種模型進(jìn)行匹配打分并返回得分最高的結(jié)果(精排)。匹配階段還會(huì)引入其他模塊,如知識圖譜和拒識模型,目的是輔助提升匹配的最終準(zhǔn)確率。

retrieval中的匹配可以看做是naive solution,詞袋+VSM, 篩選候選夠用了,但是精排需要更精致的策略,第一,要利用監(jiān)督信息做擬合,我們構(gòu)建基于問題對的訓(xùn)練語料,擬合是否匹配這個(gè)二分類目標(biāo)。第二,特征上拋棄稀疏的詞袋模型,而是構(gòu)造各種相似度來做base scorer,然后利用非線性的抗噪能力強(qiáng)的xgboost來做融合,比如我們用到詞bigram, 字bigram, 核心詞,名詞等特征集合的相似度。這種方法的優(yōu)缺點(diǎn)是一體的,由于模型只學(xué)習(xí)字面相似的特征,因此不受領(lǐng)域影響,通用性強(qiáng),適合用在冷啟動(dòng)階段;但也因?yàn)橹豢紤]字面相似,無法處理更深層的語義匹配。

那如何度量語義的相似呢。詞向量技術(shù)的興起是語義匹配的前提,所謂詞向量,是將孤立的傳統(tǒng)的token表示映射到相互關(guān)聯(lián)的向量空間中,這種關(guān)聯(lián)性,或者說是相似性,是通過詞語的上下文的來描述的。也就是說,上下文越相似的詞語,他們的語義就越相似,詞向量的歐式距離就越近。這是很容易理解的,更妙的是,通過對向量進(jìn)行簡單加減運(yùn)算,能夠呈現(xiàn)出概念的關(guān)系,比如king-man+woman的結(jié)果非常接近于queen, 因此說明詞向量能夠一定程度刻畫語義。那對句子如何做向量表示呢?一個(gè)簡單的想法是直接求和平均,WMD是另一個(gè)比較有意思且有效的做法,他將計(jì)算句子到句子的相似度建模成一個(gè)運(yùn)輸?shù)膯栴},把句子p的各個(gè)詞,運(yùn)輸?shù)絨的各個(gè)詞上,也可以說是變換;運(yùn)輸成本是詞向量的cosine相似度,而要運(yùn)輸?shù)氖歉鱾€(gè)詞在句子中的權(quán)重,用線性規(guī)劃求解一個(gè)最優(yōu)解,即為p到q的距離。另外還有個(gè)有效的方法是SIF,思路是做詞向量加權(quán)求和,但是突顯出句子中非通用的部分,即權(quán)重用詞頻倒數(shù)來計(jì)算權(quán)重,實(shí)驗(yàn)效果也很不錯(cuò)。

上面的方法有一個(gè)問題就是沒有利用有監(jiān)督信息,所以效果有明顯的天花板。下面介紹這個(gè)工作是基于深層網(wǎng)絡(luò)做有監(jiān)督學(xué)習(xí)的匹配的,做法也比較簡單,首先把句子文本用one-hot編碼,假如詞典大小是500K,那編碼完長度就是500K維,其實(shí)等于是詞袋模型,然后輸入到一個(gè)多層的神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí),最終得到一個(gè)128維的向量作為句子的語義表示,然后用cosine計(jì)算兩個(gè)句子與文檔的相似度作為模型輸出。這個(gè)方法其實(shí)是將高維稀疏的token特征映射到低維語義空間,跟詞向量的思路很類似,只不過訓(xùn)練目標(biāo)不同,并且這里使用了深層網(wǎng)絡(luò)結(jié)構(gòu)。

但是CNN對上下文的處理能力依賴于窗口大小,遠(yuǎn)距離就沒辦法處理了,因此要考慮另一種網(wǎng)絡(luò)單元RNN,這種單元是專門為時(shí)序模型量身打造的,簡單來說,每一時(shí)刻t上的隱藏狀態(tài),或者說第t個(gè)詞上的語義編碼,都由兩個(gè)輸入共同決定,即上一時(shí)刻的隱藏狀態(tài)和當(dāng)前時(shí)刻的原始輸入,而為了解決遠(yuǎn)距離傳遞導(dǎo)致的梯度消失和梯度爆炸等問題,RNN有一些變種結(jié)構(gòu)來應(yīng)對,比如 LSTM和GRU等。

CNN和RNN都是對原始輸入進(jìn)行語義編碼的基本單元,編碼后的向量就可以接入多層感知機(jī)進(jìn)行相似度計(jì)算,如果是直接計(jì)算cosine相似度,那就是dssm的升級版,而更常見的做法是把兩個(gè)句子的編碼向量拼接在一起,再經(jīng)過一個(gè)多層感知機(jī)計(jì)算相似度,而這種方法統(tǒng)稱為表達(dá)式建模;

另一種方案考慮到兩個(gè)句子之間的交互信息對學(xué)習(xí)他們是否匹配顯然更為重要,這一類方案被稱為交互式建模,右邊是一個(gè)典型的例子,他最大的不同是首先對兩個(gè)句子的所有窗口組合進(jìn)行拼接和卷積,得到交互信息。然后再進(jìn)行多次卷積和池化得到表示。其他的交互方式還包括編碼之后,進(jìn)行交互操作,如作差,點(diǎn)乘等,還有計(jì)算attention表示,也是常見的交互方式。

下面介紹我們的方案,跟上面介紹的模型相比,我們的方案主要做了兩處改動(dòng),一個(gè)是使用了稠密連接的網(wǎng)絡(luò)結(jié)構(gòu),讓rnn層的輸入和輸出拼接在一起做為下一層的輸入,第二個(gè)是混合注意力機(jī)制,即在計(jì)算attention向量進(jìn)行交互式建模的基礎(chǔ)上,增加self-attention向量計(jì)算,然后把兩個(gè)attention向量經(jīng)過門機(jī)制進(jìn)行融合,這樣做一方面引入了問句間的交互信息,同時(shí)又增強(qiáng)了對自身的表達(dá)建模。

上面的模型是比較復(fù)雜的模型,參數(shù)量有5.8M。在實(shí)際中應(yīng)用中訓(xùn)練語料會(huì)嚴(yán)重不足,為了解決這個(gè)問題,我們引入了遷移學(xué)習(xí)的策略。首先第一種是多任務(wù)聯(lián)合學(xué)習(xí),比如在擬合兩個(gè)問句是否匹配的同時(shí),也對問句進(jìn)行分類預(yù)測;另外還可以同時(shí)對匹配的問題對做seq2seq的翻譯模型訓(xùn)練。這兩個(gè)策略都證明能有效提升準(zhǔn)確率。

而另一個(gè)思路更加直觀,即引入其他領(lǐng)域的語料,所謂多語料遷移。Fine-tune即參數(shù)微調(diào)是其中一種做法,即先用通用語料訓(xùn)練網(wǎng)絡(luò),固定底層表達(dá)層的參數(shù),然后再使用領(lǐng)域語料調(diào)整上層參數(shù);另一種思路參考了對抗學(xué)習(xí)的思想,即引入一個(gè)新的任務(wù)“混淆分類器”去判別當(dāng)前樣本是來自源語料還是目標(biāo)語料,通過在損失函數(shù)中增加反向的混淆分類損失項(xiàng),讓混淆分類器盡可能地?zé)o法區(qū)分樣本的來源,從而保證共享了參數(shù)的表達(dá)網(wǎng)絡(luò)能夠?qū)W習(xí)到兩部分語料中共性的部分。

以上的介紹都是為了完成一個(gè)基本的單輪對話機(jī)器人,而實(shí)際應(yīng)用中,往往存在需要需要交互的場景,比如查詢社保余額,就需要用戶提供指定信息,如姓名,身份證號,手機(jī)號等。這種是所謂任務(wù)導(dǎo)向型機(jī)器人,而另一種,基于知識圖譜的機(jī)器人也往往會(huì)涉及到多輪交互。這里簡單介紹一下多輪對話機(jī)器人的架構(gòu),整體上是一個(gè)對話管理系統(tǒng),總的來說是管理會(huì)話狀態(tài),包含4個(gè)模塊,分別是輸入部分:自然語言理解模塊NLU,負(fù)責(zé)意圖識別和抽取槽位實(shí)體,比如這里匹配到了意圖是查詢社保余額,抽取到了社保號1234。得到的意圖和槽位值會(huì)送入到對話狀態(tài)追蹤模塊,DST,他負(fù)責(zé)會(huì)話狀態(tài)的更新,形式化來說是一個(gè)函數(shù),輸入是當(dāng)前狀態(tài)s和當(dāng)前的query經(jīng)過NLU處理過得到的意圖和槽位值q, 輸出新的狀態(tài)s‘,下一步是把s’送入DPL,對話策略模塊,這個(gè)模塊是根據(jù)新的狀態(tài)s‘輸出行動(dòng)a,通常這個(gè)決策選擇會(huì)依賴于一個(gè)外部數(shù)據(jù)庫或知識圖譜,最后,由輸出部分,自然語言生成模塊NLG負(fù)責(zé)將行動(dòng)轉(zhuǎn)換為自然語言文本,返回給用戶。

前面提到的單輪FAQ機(jī)器人,有一個(gè)問題是問答準(zhǔn)確率依賴于問答庫的質(zhì)量,而問答庫的構(gòu)建耗時(shí)費(fèi)力,所以針對數(shù)據(jù)較大的非結(jié)構(gòu)化文檔,如果可以直接從中抽取答案,是非常理想的做法。比如斯坦佛大學(xué)開源的drQA,就是基于wikipedia的語料做的一個(gè)開放域上的問答機(jī)器人,我們來看看這種閱讀理解機(jī)器人的架構(gòu)示意,他也是基于檢索重排的思路,首先把可能的文段從語料庫中摘取出來,然后送入閱讀理解模型進(jìn)行答案定位,打分,排序和選擇得分最高的答案。閱讀理解模型與匹配模型是類似的,需要先對問題和候選文段進(jìn)行編碼表示,不同之處在于最終預(yù)測的目標(biāo)是答案的起始和結(jié)束位置。我所在的團(tuán)隊(duì)在去年,在閱讀理解的權(quán)威公開測評Squad v1中取得過第一的成績,同時(shí)參加這個(gè)測評的包括了google, facebook, 微軟,阿里idst, 科大訊飛等國內(nèi)外同行。說明業(yè)界對這種技術(shù)還是非??粗氐摹?/p>

下面分享小知在把以上技術(shù)落地產(chǎn)品化的經(jīng)驗(yàn)。首先我們來看看小知的整體架構(gòu)圖,核心引擎有兩部分,一塊是上面重點(diǎn)闡述的深度語義匹配模型,另一塊是本次分享沒有展開的知識圖譜引擎,在此之上,我們構(gòu)建了FAQ機(jī)器人,多輪會(huì)話機(jī)器人(任務(wù)機(jī)器人),閑聊機(jī)器人等。以下是我們單輪和多輪機(jī)器人的示例。

在我們實(shí)際的落地項(xiàng)目中,得益于深度遷移模型的語義匹配能力和行業(yè)知識圖譜的的精準(zhǔn)匹配和輔助追問,小知機(jī)器人能夠做到95%左右的問答準(zhǔn)確率,并且節(jié)省了50%以上的服務(wù)人力,切實(shí)為政府和企業(yè)提升效率和降低成本。

在智能客服的基礎(chǔ)上,我們又打造了基于語音的電話機(jī)器人,力主融合智能客服,人工在線客服,工單系統(tǒng)和電話機(jī)器人,為客戶打造從售前售中售后的整體解決方案。

以下是電話機(jī)器人的整體架構(gòu)圖,核心是自然語言理解NLU模塊,負(fù)責(zé)識別用戶提問意圖

提取相關(guān)實(shí)體。根據(jù)NLU輸出的結(jié)果,內(nèi)置的對話管理引擎會(huì)進(jìn)行流程狀態(tài)流轉(zhuǎn)和跟蹤。

另外,ASR語音識別和TTS語音合成是不可或缺的重要服務(wù),這三個(gè)模塊相互協(xié)作,共同完成與用戶的交互。

最后對智能問答的未來發(fā)展提幾點(diǎn)我的看法。目前學(xué)術(shù)界比較公認(rèn)的一個(gè)方向是,需要更有機(jī)地結(jié)合模型和規(guī)則,而在問答領(lǐng)域,規(guī)則的一大組成部分就是知識圖譜,包括開放領(lǐng)域的知識圖譜和專業(yè)領(lǐng)域知識圖譜。而更進(jìn)一步地,我們需要研究帶有推理性質(zhì)的事理型知識圖譜去描述領(lǐng)域內(nèi)的規(guī)則和知識,讓機(jī)器人能夠處理帶有復(fù)雜條件的問題,提供更智能的回復(fù)。在我看來,智能問答的一個(gè)突破口就在于解決以上三個(gè)問題。以上就是今天分享的內(nèi)容,謝謝大家。

主講人介紹:

陳松堅(jiān),騰訊數(shù)據(jù)平臺(tái)部算法高級研究員,有著8 年的 NLP 研發(fā)經(jīng)驗(yàn),2017 年加入騰訊 TEG 數(shù)據(jù)平臺(tái)部,負(fù)責(zé)智能客服產(chǎn)品騰訊小知的算法規(guī)劃和落地。負(fù)責(zé)過多個(gè)智能客服項(xiàng)目,對封閉領(lǐng)域的智能問答有豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)。

如需要了解產(chǎn)品詳情,可電話咨詢專業(yè)客服人員:15358521011(微信同號)

標(biāo)簽:涼山 甘肅 迪慶 北京 西藏 麗江 黔西 岳陽

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《電話機(jī)器人架構(gòu)圖(智能電話機(jī)器人)》,本文關(guān)鍵詞  電話,機(jī)器人,架,構(gòu)圖,智能,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《電話機(jī)器人架構(gòu)圖(智能電話機(jī)器人)》相關(guān)的同類信息!
  • 本頁收集關(guān)于電話機(jī)器人架構(gòu)圖(智能電話機(jī)器人)的相關(guān)信息資訊供網(wǎng)民參考!
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266