導(dǎo)語:所謂木秀于林,盛名之下,覬覦者眾。被業(yè)界公認(rèn)為人工智能“皇冠上的明珠”的認(rèn)知智能,正在被全球領(lǐng)先的科技企業(yè)競(jìng)相逐鹿。
作為本領(lǐng)域龍頭企業(yè)之一的神州泰岳,自10年前便開始在認(rèn)知智能領(lǐng)域持續(xù)探索,長(zhǎng)期積累下已取得了顯著成績(jī)。2018年6月30日,神州泰岳亮相2018中國(guó)國(guó)際軟件博覽會(huì),正式上線全國(guó)首個(gè)智能語義開放平臺(tái)——中文信息(深度)處理開放創(chuàng)新平臺(tái)。
在此次軟博會(huì)人工智能高端論壇上,工信部及軟博會(huì)組委會(huì)選擇并推薦神州泰岳副總裁李國(guó)東發(fā)表主題演講,闡述神州泰岳多年來在語言智能領(lǐng)域的基礎(chǔ)技術(shù)研究、產(chǎn)品落地上的貢獻(xiàn),同時(shí)展示了中文信息(深度)處理開放創(chuàng)新平臺(tái)在打破中文認(rèn)知領(lǐng)域產(chǎn)業(yè)壁壘,加速產(chǎn)學(xué)研落地,構(gòu)建并推動(dòng)整體產(chǎn)業(yè)生態(tài)發(fā)展方面所作出的貢獻(xiàn)。
神州泰岳副總裁李國(guó)東發(fā)表演講
深度聚焦智能語義 實(shí)現(xiàn)產(chǎn)學(xué)研用育完整閉環(huán)生態(tài)
“人工智能的兩個(gè)重要部分:“感知”和“認(rèn)知”。我國(guó)的漢語及少數(shù)民族語言構(gòu)成了我們獨(dú)特的中文認(rèn)知智能領(lǐng)域。我國(guó)早在1981年就由著名科學(xué)家錢偉長(zhǎng)倡導(dǎo),成立了中國(guó)中文信息學(xué)會(huì),學(xué)會(huì)專注于中文認(rèn)知智能、語言智能、語義智能領(lǐng)域的研究,集中了這一領(lǐng)域的所有專家學(xué)者。中文信息學(xué)會(huì)作為國(guó)家的一級(jí)學(xué)會(huì)甚至比人工智能學(xué)會(huì)還早。在認(rèn)知智能領(lǐng)域的世界最高學(xué)會(huì)ACL,我國(guó)已經(jīng)送出了兩任理事長(zhǎng),我國(guó)科學(xué)家李生還獲得了ACL的終身成就獎(jiǎng)。在學(xué)術(shù)研究和基礎(chǔ)技術(shù)上我國(guó)在這一領(lǐng)域處于世界前列。
相對(duì)于轟轟烈烈的學(xué)術(shù)研究界,我國(guó)認(rèn)知智能產(chǎn)業(yè)落地方面還處在成熟前期,尚沒有像感知智能一樣大發(fā)展,阻礙發(fā)展的主要障礙來自于:
1、本領(lǐng)域技術(shù)門檻高,技術(shù)需要長(zhǎng)期積累,一個(gè)算法一個(gè)技術(shù)改變不了整體。
2、在認(rèn)知智能產(chǎn)業(yè),早年具有戰(zhàn)略眼光的公司不多,時(shí)至今日才感覺缺少長(zhǎng)線布局。
3、大量的技術(shù)成果基本都掌握在能夠長(zhǎng)期潛心基礎(chǔ)研究的學(xué)校和研究機(jī)構(gòu)當(dāng)中。
4、大量的技術(shù)成果尚沒有完成成果落地和商業(yè)轉(zhuǎn)移,長(zhǎng)此以往將阻礙技術(shù)的進(jìn)一步發(fā)展。”中國(guó)中文信息學(xué)會(huì)秘書長(zhǎng)孫樂與神州泰岳副總裁李國(guó)東在談到我國(guó)認(rèn)知領(lǐng)域現(xiàn)狀時(shí)一致這樣認(rèn)為。
認(rèn)知智能的核心是自然語言理解,自然語言理解的核心技術(shù)就是語義理解,或者叫智能語義。在智能語義方面,神州泰岳至今已經(jīng)進(jìn)行了十多年的耕耘和技術(shù)積累,堪稱國(guó)內(nèi)最早專注于認(rèn)知智能領(lǐng)域的公司,同時(shí)由于公司長(zhǎng)期業(yè)務(wù)的復(fù)雜和繁瑣性,神州泰岳在基礎(chǔ)技術(shù)以外更擅長(zhǎng)于人工智能的應(yīng)用和解決方案的落地,因此獲得了國(guó)際評(píng)估機(jī)構(gòu)Gartner的積極關(guān)注和肯定。
正是由于神州泰岳的專注和堅(jiān)持,2017年底,得到了我國(guó)認(rèn)知智能領(lǐng)域的最高學(xué)會(huì)中國(guó)中文信息學(xué)會(huì)的認(rèn)可,唯一指定了神州泰岳為學(xué)會(huì)產(chǎn)學(xué)研落地的合作伙伴,同時(shí)指導(dǎo)神州泰岳開發(fā)、建設(shè)了中文信息(深度)處理平臺(tái)。
據(jù)神州泰岳副總裁李國(guó)東介紹,中文信息(深度)處理平臺(tái)是依托于中國(guó)中文信息學(xué)會(huì)會(huì)員,專注于認(rèn)識(shí)智能、語言智能,語義智能技術(shù)和產(chǎn)品及服務(wù),平臺(tái)將囊括大部分專家學(xué)者的科研成果和產(chǎn)品,以及相關(guān)合作伙伴打造的產(chǎn)品的服務(wù)。
相比其他企業(yè)級(jí)AI平臺(tái),中文信息(深度)處理平臺(tái)全面覆蓋了中文語言智能及其相關(guān)領(lǐng)域最前沿的技術(shù)成果和產(chǎn)品,同時(shí)圍繞認(rèn)知智能打造開發(fā)工具、將技術(shù)PaaS化、SaaS化,構(gòu)建并完成了產(chǎn)學(xué)研用育的完整閉環(huán)生態(tài)。中文信息(深度)處理平臺(tái)肩負(fù)著整體認(rèn)知智能、語言智能行業(yè)的創(chuàng)新、孵化和落地任務(wù),是真正的產(chǎn)業(yè)級(jí)平臺(tái)而不只是企業(yè)級(jí)平臺(tái)。
從該平臺(tái)產(chǎn)生的時(shí)間點(diǎn)看,認(rèn)知智能正處于成熟前期,馬上要進(jìn)入大發(fā)展;從平臺(tái)的特點(diǎn)看,跨產(chǎn)學(xué)研,跨企業(yè)的最全面覆蓋,是真正的天然產(chǎn)業(yè)生態(tài)平臺(tái);從平臺(tái)的目的看,更加開放,加速技術(shù)創(chuàng)新,加速產(chǎn)品落地。以上幾點(diǎn)造就了平臺(tái)的唯一性和無法復(fù)制性。
圍繞認(rèn)知智能領(lǐng)域,平臺(tái)形成了“一云、四塊、兩線”的總體發(fā)展戰(zhàn)略。
“一云”是基于現(xiàn)有公有云技術(shù),附加開發(fā)工具和開發(fā)環(huán)境,構(gòu)建完整的語言智能IaaS+PaaS+SaaS云生態(tài)。云端實(shí)現(xiàn)了平臺(tái)隨處可見、隨處可用。
“四塊”是建立在云平臺(tái)基礎(chǔ)上的四個(gè)核心業(yè)務(wù)板塊:開放板塊主要將本領(lǐng)域?qū)<覍W(xué)者、合作伙伴、神州泰岳自身的技術(shù)以分為基礎(chǔ)服務(wù)、應(yīng)用服務(wù)、解決方案的幾個(gè)維度,以多種形式在云端展示、開放,側(cè)重技術(shù)和產(chǎn)品隨處可看、可試、可用,降低技術(shù)和產(chǎn)品的匹配和尋找使用門檻;創(chuàng)新板塊則提供AI創(chuàng)新輔助工具集、產(chǎn)品管理、實(shí)施咨詢等工具類產(chǎn)品服務(wù),側(cè)重解決技術(shù)的產(chǎn)品落地和技術(shù)持續(xù)創(chuàng)新問題;數(shù)據(jù)板塊則是針對(duì)大數(shù)據(jù)領(lǐng)域,為行業(yè)提供訓(xùn)練數(shù)據(jù)集、評(píng)測(cè)數(shù)據(jù)集、大數(shù)據(jù)工具集等數(shù)據(jù)服務(wù),打破由于數(shù)據(jù)不足而造成的通用技術(shù)難以在垂直行業(yè)落地的壁壘;培訓(xùn)互動(dòng)板塊會(huì)涉及實(shí)訓(xùn)課程、智能問答中心、專家互動(dòng)等多元培訓(xùn)服務(wù),培養(yǎng)人工智能技術(shù)人才,降低技術(shù)溝通門檻。“四塊”使整個(gè)平臺(tái)貫穿了從成果展示品牌建設(shè)、創(chuàng)新項(xiàng)目落地、數(shù)據(jù)共享產(chǎn)品孵化到技術(shù)推廣知識(shí)分享全環(huán)節(jié)。
“兩線”則從線上品牌孵化到線下成果轉(zhuǎn)化和落地推廣,充分發(fā)揮了創(chuàng)新云平臺(tái)的實(shí)用性與業(yè)務(wù)引領(lǐng)性。
平臺(tái)一期已匯聚合作院校20余所,專家團(tuán)隊(duì)40余家,NLP服務(wù)120多個(gè),覆蓋了本領(lǐng)域的主要技術(shù),今后將全面覆蓋國(guó)內(nèi)智能語義、中文語言智能及其相關(guān)領(lǐng)域最前沿和專業(yè)的技術(shù)成果和產(chǎn)品。該平臺(tái)的正式上線使神州泰岳在語義工具數(shù)量上位居同行首位,同時(shí)神州泰岳將平臺(tái)的基礎(chǔ)服務(wù)免費(fèi)開放,幫助開發(fā)者快速具備語義分析能力,拓展更多的應(yīng)用場(chǎng)景,推動(dòng)行業(yè)應(yīng)用發(fā)展。
李國(guó)東副總裁表示,中文信息(深度)處理平臺(tái)將加速企業(yè)孵化轉(zhuǎn)型,是認(rèn)知領(lǐng)域獨(dú)角獸平臺(tái)。未來,神州泰岳將繼續(xù)以實(shí)際行動(dòng)堅(jiān)守人工智能語義發(fā)展戰(zhàn)略。
為傳統(tǒng)行業(yè)全面賦能 著眼語義識(shí)別的全場(chǎng)景應(yīng)用
任何一個(gè)新技術(shù)最重要的是如何對(duì)現(xiàn)實(shí)場(chǎng)景進(jìn)行改造、達(dá)到自身技術(shù)落地,對(duì)于與現(xiàn)實(shí)結(jié)合緊密的語義智能領(lǐng)域更是如此。經(jīng)過多年的實(shí)踐探索,神州泰岳的智能語義技術(shù)已經(jīng)在公安、金融、政務(wù)、教育行業(yè)找到了眾多的落地場(chǎng)景,并開始為傳統(tǒng)行業(yè)全面賦能。
例如在智慧公安領(lǐng)域,認(rèn)知智能、語義智能技術(shù)可以應(yīng)用在刑偵、經(jīng)偵、治安、情報(bào)、法制等非常具體的應(yīng)用場(chǎng)景。通過整合案事件、現(xiàn)勘、筆錄、警情、人口、網(wǎng)絡(luò)數(shù)據(jù)等各警種來源的海量數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行交叉碰撞和智能分析,從而更好地為公安局提供非結(jié)構(gòu)化文本分析、數(shù)據(jù)分析服務(wù)、互聯(lián)網(wǎng)數(shù)據(jù)采集服務(wù)、互聯(lián)網(wǎng)數(shù)據(jù)分析與監(jiān)測(cè)等服務(wù),協(xié)助公安局完成公安業(yè)務(wù)數(shù)據(jù)的深度分析和挖掘等工作。
在金融領(lǐng)域,為了解決業(yè)務(wù)的規(guī)范表達(dá)與自然語言表達(dá)的復(fù)雜性及多樣性之間的矛盾,基于智能語義、認(rèn)知智能技術(shù),具備完全面向業(yè)務(wù)建模的能力,可讓研發(fā)人員專注于業(yè)務(wù)理解和業(yè)務(wù)表達(dá),極大地縮短行業(yè)應(yīng)用場(chǎng)景創(chuàng)新的研發(fā)周期,并提高應(yīng)用質(zhì)量。在銀行業(yè),神州泰岳連續(xù)拿下“中、工、建”等多家客戶,并多次在于國(guó)際IT巨頭的競(jìng)爭(zhēng)中脫穎而出。
在智慧政務(wù)領(lǐng)域,基于中文信息處理,可提供多元數(shù)據(jù)的的智能公文輔助寫作系統(tǒng)。同時(shí)結(jié)合知識(shí)圖譜的技術(shù),可以實(shí)現(xiàn)對(duì)重大事件的預(yù)知、預(yù)告、預(yù)判,另外綜合管廊通信安防一體化解決方案,構(gòu)筑起城市地下智慧神經(jīng)系統(tǒng)。
智能語義領(lǐng)域想要取得更大發(fā)展除了自身的技術(shù)進(jìn)步外,更重要的在于通過生態(tài)伙伴的廣泛合作,不斷積累技術(shù)和行業(yè)經(jīng)驗(yàn)。如今,神州泰岳在中國(guó)中文信息處理學(xué)會(huì)指導(dǎo)下,已平臺(tái)一期率先聚集了清華、北大、哈工大、北師大、蘇州大學(xué)、東北大學(xué)、中科院自動(dòng)化所、軟件所等國(guó)內(nèi)20多所自然語言處理核心研究機(jī)構(gòu)的40余團(tuán)隊(duì),今后更將擴(kuò)展到學(xué)研的全面覆蓋和企業(yè)的大面積覆蓋,將行業(yè)應(yīng)用、數(shù)據(jù)、實(shí)施能力與先進(jìn)技術(shù)配套結(jié)合,讓人工智能技術(shù)能真正具體的服務(wù)于企業(yè)、行業(yè)、社會(huì),共同構(gòu)建行業(yè)生態(tài),充分釋放AI的生產(chǎn)力。
以此次軟博會(huì)和平臺(tái)一起上線為契機(jī),神州泰岳將致力于全面打破認(rèn)知智能的壁壘,利用產(chǎn)學(xué)研聯(lián)合進(jìn)一步強(qiáng)化自身技術(shù),通過打造產(chǎn)學(xué)研用育的閉環(huán)生態(tài),為智能語義與其他行業(yè)的全面融合打下堅(jiān)實(shí)基礎(chǔ),并最終推動(dòng)認(rèn)知智能走向成熟。